Portal ChicoSabeTudoPortal ChicoSabeTudoPortal ChicoSabeTudo
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Font ResizerAa
Portal ChicoSabeTudoPortal ChicoSabeTudo
Font ResizerAa
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Procurar
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA

DESTAQUES

VÍDEO: Agricultor de 61 anos é engolido por cobra píton de 8 metros em plantação

Capa.jpg

Paulo Afonso: Morador do Povoado Riacho morre em grave acidente com carreta

Operação Artemis: Forças integradas capturam pauloafonsinos do PCC escondidos em Minas Gerais

Se conecte com a gente

Encontre nossas redes sociais
1.40MSeguidoresLike
1.5kSeguidoresSeguir
126kSeguidoresSeguir
13.2kSubscribersSubscribe
Todos os direitos reservados Portal ChicoSabeTudo @2024
Curiosidades e Tecnologia

OpenAI encontra padrões ocultos que guiam comportamento de IAs

A OpenAI anunciou a descoberta de padrões internos em IAs ligados a comportamentos como toxicidade e sarcasmo, abrindo caminho para maior controle.

Última atualização: 20/06/2025 18:51
Compartilhar
(Imagem: Vitor Miranda/Shutterstock)
(Imagem: Vitor Miranda/Shutterstock)
Compartilhar

A OpenAI identificou padrões internos em modelos de inteligência artificial que estão associados a comportamentos indesejados, como toxicidade, sarcasmo e respostas com intenções maliciosas. Esta descoberta, detalhada em um novo estudo da empresa, busca trazer mais transparência ao processo decisório das IAs, que frequentemente operam como uma “caixa-preta”.

Detecção de “Personas” Internas

Os pesquisadores, ao analisarem os padrões numéricos internos que orientam as respostas dos modelos, notaram que certas ativações se comportavam como “personas” — entidades internas que, quando ativadas, geravam comportamentos específicos. Um desses padrões estava diretamente ligado a respostas tóxicas, incluindo a propagação de informações falsas ou a sugestão de ações perigosas.

Ajustando matematicamente essas ativações, os cientistas demonstraram que é possível reduzir ou até mesmo amplificar esse tipo de comportamento problemático. De acordo com Dan Mossing, pesquisador da OpenAI, esse avanço oferece um método para detectar e corrigir o desalinhamento em modelos de IA que já estão em produção.

Tendência em Interpretabilidade de IA

A abordagem adotada pela OpenAI reflete uma crescente tendência entre grandes empresas de tecnologia, como a DeepMind e a Anthropic, que têm investido pesadamente em “interpretabilidade”. Esta área da pesquisa visa desvendar o funcionamento interno complexo dos modelos de inteligência artificial, compreendendo como eles chegam a determinadas decisões.

A pesquisa da OpenAI foi, em parte, inspirada por um estudo anterior conduzido por Owain Evans, da Universidade de Oxford. Esse trabalho demonstrou que modelos de IA que foram treinados com exemplos de código inseguro podiam, posteriormente, exibir comportamentos maliciosos em outras tarefas, um fenômeno conhecido como desalinhamento emergente.

Notavelmente, a OpenAI descobriu que pode “reeducar” modelos desalinhados com poucas centenas de exemplos de interações seguras. Essa capacidade permite uma mitigação de riscos mais eficiente, reforçando a importância de entender como esses modelos operam internamente para garantir um desenvolvimento ético e seguro da tecnologia.

TAGS:inteligência artificialOpenAI

MAIS LIDAS

Trabalhador morre ao ser sugado por máquina de triturar madeira em serraria na Bahia
Polícia e investigação
Drogasil abre novas oportunidades de trabalho em Paulo Afonso e diversas cidades da Bahia
Curiosidades e Tecnologia
Apresentador do “Fiscal do Povo” é assassinado com furadeira em São Paulo
Polícia e investigação
- Publicidade -

MAIS NOTÍCIAS

(Imagem: Sdecoret/Adobe Stock)
Curiosidades e Tecnologia

IA como gerente de loja resulta em prejuízo

Imagem: Africa Studio/Shutterstock
Curiosidades e Tecnologia

Pesquisa da USP busca segredos da longevidade em células de centenários

Chatbot Já Esteve Envolvido Em Polêmicas (Imagem: Bangla Press/Shutterstock)
Curiosidades e Tecnologia

Grok, IA de Elon Musk, gera polêmica com comentários antissemitas

Evento Desta Quarta-Feira (9) Promete Muitas Novidades (Imagem: Robert Plociennik/Shutterstock)
Curiosidades e Tecnologia

Samsung revela linha Galaxy Unpacked: dobráveis e vestíveis em foco

Mostrar mais
Portal ChicoSabeTudo

ACESSE

  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Que bom que voltou!!!

Acesse sua conta

Username or Email Address
Password

Lost your password?