Portal ChicoSabeTudoPortal ChicoSabeTudoPortal ChicoSabeTudo
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Font ResizerAa
Portal ChicoSabeTudoPortal ChicoSabeTudo
Font ResizerAa
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Procurar
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA

DESTAQUES

Segundo corpo é encontrado na Serra da Santa Cruz, em Jeremoabo

Troca de tiros entre Rondesp e suspeitos termina com um morto no povoado Caiçara, zona rural de Santa Brígida

Identidade do segundo corpo achado na Serra da Santa Cruz, em Jeremoabo, é confirmada

Se conecte com a gente

Encontre nossas redes sociais
1.40MSeguidoresLike
1.5kSeguidoresSeguir
126kSeguidoresSeguir
13.2kSubscribersSubscribe
Todos os direitos reservados Portal ChicoSabeTudo @2024
- Publicidade -
Campanha Vacina da Gripe - Governo da Bahia
Curiosidades e Tecnologia

OpenAI encontra padrões ocultos que guiam comportamento de IAs

A OpenAI anunciou a descoberta de padrões internos em IAs ligados a comportamentos como toxicidade e sarcasmo, abrindo caminho para maior controle.

Última atualização: 20/06/2025 18:51
Compartilhar
(Imagem: Vitor Miranda/Shutterstock)
(Imagem: Vitor Miranda/Shutterstock)
Compartilhar

A OpenAI identificou padrões internos em modelos de inteligência artificial que estão associados a comportamentos indesejados, como toxicidade, sarcasmo e respostas com intenções maliciosas. Esta descoberta, detalhada em um novo estudo da empresa, busca trazer mais transparência ao processo decisório das IAs, que frequentemente operam como uma “caixa-preta”.

- Anúncio-

Detecção de “Personas” Internas

Os pesquisadores, ao analisarem os padrões numéricos internos que orientam as respostas dos modelos, notaram que certas ativações se comportavam como “personas” — entidades internas que, quando ativadas, geravam comportamentos específicos. Um desses padrões estava diretamente ligado a respostas tóxicas, incluindo a propagação de informações falsas ou a sugestão de ações perigosas.

Ajustando matematicamente essas ativações, os cientistas demonstraram que é possível reduzir ou até mesmo amplificar esse tipo de comportamento problemático. De acordo com Dan Mossing, pesquisador da OpenAI, esse avanço oferece um método para detectar e corrigir o desalinhamento em modelos de IA que já estão em produção.

Tendência em Interpretabilidade de IA

A abordagem adotada pela OpenAI reflete uma crescente tendência entre grandes empresas de tecnologia, como a DeepMind e a Anthropic, que têm investido pesadamente em “interpretabilidade”. Esta área da pesquisa visa desvendar o funcionamento interno complexo dos modelos de inteligência artificial, compreendendo como eles chegam a determinadas decisões.

- Anúncio-

A pesquisa da OpenAI foi, em parte, inspirada por um estudo anterior conduzido por Owain Evans, da Universidade de Oxford. Esse trabalho demonstrou que modelos de IA que foram treinados com exemplos de código inseguro podiam, posteriormente, exibir comportamentos maliciosos em outras tarefas, um fenômeno conhecido como desalinhamento emergente.

Notavelmente, a OpenAI descobriu que pode “reeducar” modelos desalinhados com poucas centenas de exemplos de interações seguras. Essa capacidade permite uma mitigação de riscos mais eficiente, reforçando a importância de entender como esses modelos operam internamente para garantir um desenvolvimento ético e seguro da tecnologia.

- Advertisement -
TAGS:inteligência artificialOpenAI

MAIS LIDAS

Mulher agredida com mais de 60 socos mostra como ficou o rosto após cirurgia de reconstrução facial
Polícia e investigação
Ministério Público recebe denúncia contra Nattan por cena com fã com nanismo
Entretenimento
“Entreguei viva e recebi um cadáver”, diz mãe de menina atingida por penteadeira dentro de escola
Polícia e investigação
- Publicidade -

MAIS NOTÍCIAS

Foto: Reprodução
Curiosidades e Tecnologia

Fiação pega fogo em Sussuarana, Salvador

Aeronave Da Latam Airlines Se Aproxima Para Pouso No Aeroporto Internacional De Guarulhos / Crédito: Rafaelnlins (Shutterstock/Reprodução)
Curiosidades e Tecnologia

LATAM melhora rastreio de bagagem com AirTag para usuários iPhone

Pessoa Fumando Maconha (Imagem: Shutterstock/Dmytro Tyshchenko)
Curiosidades e Tecnologia

Maconha e câncer bucal: estudo da UCSD alerta para riscos

Curiosidades e Tecnologia

Mutirão da defensoria oferece exame de DNA gratuito e reconhecimento de paternidade em Paulo Afonso no dia 15 de agosto

Curiosidades e Tecnologia

Agerba afirma que não recebeu notificação oficial sobre encerramento da Viação Regional na linha Paulo Afonso–Salvador

Foto: Reprodução Pexels
Curiosidades e Tecnologia

Eli Lilly anuncia eficácia de novo remédio oral para perda de peso

Curiosidades e Tecnologia

Equipe do Samu usa carro de boi para resgatar paciente em Inhapi

Aplicativo Foi Criado Em Resposta Ao Banimento De Trump Das Principais Plataformas (Imagem: Rokas Tenys/Shutterstock)
Curiosidades e Tecnologia

Truth Social lança busca com IA e parceria Perplexity

Mostrar mais
Portal ChicoSabeTudo

ACESSE

  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Que bom que voltou!!!

Acesse sua conta

Username or Email Address
Password

Lost your password?