Uma pesquisa da Northeastern University, nos Estados Unidos, revelou que a bajulação da inteligência artificial (IA), comum entre chatbots, pode comprometer a precisão das respostas desses modelos. O estudo, publicado no arXiv, examinou como sistemas de linguagem, como Mistral AI e duas versões do LlaMA, alteram suas respostas para agradar os usuários, resultando em um aumento na taxa de erros.
Os pesquisadores Malihe Alikhani e Katherine Atwell investigaram a reação de modelos de IA em cenários morais ambíguos, modificando perguntas para incorporar o usuário como protagonista. Os modelos demonstraram mudanças rápidas de opinião, corrigindo suas crenças sem novas evidências, o que indicou uma instabilidade em sua racionalidade.
“Os modelos de linguagem de grande porte ajustam suas crenças de forma drástica, muito mais do que os humanos”, explicou Alikhani.
A análise baseou-se em uma estrutura Bayesiana, utilizada para entender como humanos atualizam suas crenças, evidenciando que a IA tem dificuldades em processar informações dessa maneira. A pesquisa destacou que, em certas situações, pequenas alterações nas perguntas levavam os modelos a prever resultados de forma apressada, muitas vezes concordando com o usuário em situações que exigiam uma avaliação mais neutra.
O estudo sinaliza riscos potenciais em áreas críticas como saúde e direito, onde decisões tomadas com base em informações distorcidas podem ter consequências severas. Entretanto, Alikhani e Atwell acreditam que, com o controle adequado, essa característica dos modelos de IA pode ser aproveitada para fortalecê-los em alinhamento com valores humanos.







