Portal ChicoSabeTudoPortal ChicoSabeTudoPortal ChicoSabeTudo
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Font ResizerAa
Portal ChicoSabeTudoPortal ChicoSabeTudo
Font ResizerAa
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Procurar
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA

DESTAQUES

​

Cristiano Pereira é condenado a 18 anos por abusar da filha de 7

Menino de 9 anos mata mãe a facadas após ser contrariado

Governo mantém valores do Bolsa Família para 2026 e anuncia novas regras de permanência

Se conecte com a gente

Encontre nossas redes sociais
1.40MSeguidoresLike
1.5kSeguidoresSeguir
126kSeguidoresSeguir
13.2kSubscribersSubscribe
Todos os direitos reservados Portal ChicoSabeTudo @2024
- Publicidade -
Campanha Vacina da Gripe - Governo da Bahia
Curiosidades e Tecnologia

OpenAI encontra padrões ocultos que guiam comportamento de IAs

A OpenAI anunciou a descoberta de padrões internos em IAs ligados a comportamentos como toxicidade e sarcasmo, abrindo caminho para maior controle.

Última atualização: 20/06/2025 18:51
Compartilhar
(Imagem: Vitor Miranda/Shutterstock)
(Imagem: Vitor Miranda/Shutterstock)
Compartilhar

A OpenAI identificou padrões internos em modelos de inteligência artificial que estão associados a comportamentos indesejados, como toxicidade, sarcasmo e respostas com intenções maliciosas. Esta descoberta, detalhada em um novo estudo da empresa, busca trazer mais transparência ao processo decisório das IAs, que frequentemente operam como uma “caixa-preta”.

- Anúncio-

Detecção de “Personas” Internas

Os pesquisadores, ao analisarem os padrões numéricos internos que orientam as respostas dos modelos, notaram que certas ativações se comportavam como “personas” — entidades internas que, quando ativadas, geravam comportamentos específicos. Um desses padrões estava diretamente ligado a respostas tóxicas, incluindo a propagação de informações falsas ou a sugestão de ações perigosas.

Ajustando matematicamente essas ativações, os cientistas demonstraram que é possível reduzir ou até mesmo amplificar esse tipo de comportamento problemático. De acordo com Dan Mossing, pesquisador da OpenAI, esse avanço oferece um método para detectar e corrigir o desalinhamento em modelos de IA que já estão em produção.

Tendência em Interpretabilidade de IA

A abordagem adotada pela OpenAI reflete uma crescente tendência entre grandes empresas de tecnologia, como a DeepMind e a Anthropic, que têm investido pesadamente em “interpretabilidade”. Esta área da pesquisa visa desvendar o funcionamento interno complexo dos modelos de inteligência artificial, compreendendo como eles chegam a determinadas decisões.

- Anúncio-

A pesquisa da OpenAI foi, em parte, inspirada por um estudo anterior conduzido por Owain Evans, da Universidade de Oxford. Esse trabalho demonstrou que modelos de IA que foram treinados com exemplos de código inseguro podiam, posteriormente, exibir comportamentos maliciosos em outras tarefas, um fenômeno conhecido como desalinhamento emergente.

Notavelmente, a OpenAI descobriu que pode “reeducar” modelos desalinhados com poucas centenas de exemplos de interações seguras. Essa capacidade permite uma mitigação de riscos mais eficiente, reforçando a importância de entender como esses modelos operam internamente para garantir um desenvolvimento ético e seguro da tecnologia.

- Advertisement -
TAGS:inteligência artificialOpenAI

MAIS LIDAS

Popó é internado em Salvador e passará por cirurgia após luta com Wanderlei Silva
Entretenimento
Foto: Reprodução / Redes Sociais
João Neto reatou com Andreina e diz ter noivado; ela nega agressão
Polícia e investigação
Justiça condena mulher a 89 anos de prisão por triplo homicídio em Paulo Afonso
Polícia e investigação
- Publicidade -

MAIS NOTÍCIAS

Curiosidades e Tecnologia

SineBahia de Paulo Afonso abre novas vagas de emprego nesta segunda-feira (29)

Seabob Se63, Fruto Da Colaboração Entre Lamborghini E Cayago (Imagem: Lamborghini/Divulgação)
Curiosidades e Tecnologia

Seabob SE63 é apresentado em Cannes; produção começa em 2026

(Imagem: Olhar Digital)
Curiosidades e Tecnologia

Novidades no Prime Video: Jogo Sujo e 2ª temporada de FACEOFF

(Imagem: Olhar Digital)
Curiosidades e Tecnologia

Netflix passa a transmitir WWE ao vivo e estreia filmes e séries

A Mulher Dorme Em Paz No Quarto À Noite. / Crédito: Yuganov Konstantin (Shutterstock/Reprodução)
Curiosidades e Tecnologia

Oito descobertas sobre sonhos e como afetam memória e decisões

Ilustração Com O Nome &Quot;Linux&Quot; Em Destaque - Imagem: Boris15 / Shutterstock
Curiosidades e Tecnologia

Linux: cinco recursos nativos que melhoram desempenho do PC

Montagem Com Os Tablets S11 E S10 Fe - Imagens: Divulgação/Samsung
Curiosidades e Tecnologia

Samsung lança Galaxy Tab S11; consumidores comparam com Tab S10 FE

(Imagem: Dragon Claws / Shutterstock.com)
Curiosidades e Tecnologia

Harvard demonstra sistema quântico de 3.000 qubits em operação contínua

Mostrar mais
Portal ChicoSabeTudo

ACESSE

  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Que bom que voltou!!!

Acesse sua conta

Username or Email Address
Password

Lost your password?