Modelos de peso aberto recém-lançados ajudam desenvolvedores a avaliar riscos e trazem mais clareza às decisões tomadas por sistemas de IA
Assuntos relacionados à Inteligência Artificial

Assuntos relacionados à OpenAI
A OpenAI divulgou nesta quarta-feira (29) o lançamento de dois modelos de IA destinados a ajudar desenvolvedores a identificar riscos à segurança em plataformas online.
Batizados de gpt-oss-safeguard-120b e gpt-oss-safeguard-20b, esses modelos são variantes aprimoradas dos gpt-oss apresentados em agosto e diferem entre si pelo tamanho, indicado nos próprios nomes.

- Modelos do tipo “peso aberto” têm seus parâmetros tornados públicos.
- Isso oferece mais visibilidade e possibilita monitoramento sobre como previsões e respostas são geradas, embora não se trate de código-fonte totalmente editável pelo usuário.
- A OpenAI afirma que organizações poderão ajustar esses modelos às suas políticas internas, obtendo transparência sobre o raciocínio por trás de cada decisão.
- Na prática, plataformas de avaliação podem filtrar análises fraudulentas e comunidades de jogos, sinalizar publicações relacionadas a trapaças.

Parcerias e comunidade de segurança
O desenvolvimento desses modelos contou com a participação da ROOST (Robust Open Online Safety Tools), além de contribuições do Discord e do SafetyKit.
Por ora, as versões estão disponíveis em pré-visualização para fins de pesquisa, enquanto a OpenAI busca o retorno de especialistas e profissionais de segurança. A ROOST também organiza uma comunidade de modelos para orientar o uso responsável da IA em ambientes online.
O lançamento ocorre em meio a críticas sobre o rápido crescimento da OpenAI e a discussões sobre sua governança. Coincide com a conclusão de sua recapitalização, que consolidou uma estrutura sem fins lucrativos com participação majoritária em atividades comerciais.
De acordo com Camille François, presidente da ROOST, “À medida que a IA avança, as ferramentas e pesquisas de segurança precisam progredir na mesma velocidade, e estar ao alcance de todos.” Usuários qualificados podem baixar os pesos dos modelos no Hugging Face.










