Google atualiza Gemini 2.5 Pro para superar concorrentes em desempenho

O Google falou sobre uma grande atualização para o Gemini 2.5 Pro. Essa novidade corrige certos problemas da versão anterior, conhecida como I/O Edition ou 05-06, que tinha foco na atualização de codificação.

- Anúncio-

Segundo o Google, o upgrade gera códigos de um jeito bem melhor que a versão antiga. Ele alcançou uma pontuação alta de 82,2% no teste de benchmark Aider Polyglot. Com esses valores, o Gemini 2.5 Pro parece superar o que as concorrentes como OpenAI, Anthropic e DeepSeek têm de melhor, e com bastante folga.

O que mudou e quando chega?

Enquanto o Gemini 2.5 Flash foi liberado rápido para todo mundo, parece que o 2.5 Pro não seguirá o mesmo caminho. As atualizações anteriores do sistema de inteligência artificial foram criticadas por não deixarem o desempenho ideal para todos.

Logan Kilpatrick, do Google, falou no X que a empresa levou os feedbacks a sério. Ele disse que o novo update “fecha a lacuna da atualização 03-25”, indicando que teremos uma IA mais criativa e com melhor formatação de respostas, como aponta o ArsTechnica.

- Anúncio-

A versão 06-05 suporta orçamentos de pensamento que podem ser configurados para desenvolvedores.
Eles esperam que a atualização se torne um “lançamento estável de longo prazo”.
A expectativa é que a atualização possa ser liberada para todos em algumas semanas.

Testes mostram a força do Gemini

O Google valoriza muito os testes feitos pelos usuários do LMArena e WebDevArena. Nesses testes, é possível comparar as respostas de cada modelo de linguagem grande (LLM) lado a lado sem saber qual é qual, algo como um teste cego.

No LMArena, o Gemini teve um salto de 24 pontos, e no WebDevArena, foram 35 pontos a mais. Como o Gemini Pro já estava na liderança, essa vantagem só aumentou, reforçando sua posição no mercado.

- Advertisement -

O ArsTechnica testou o Gemini 2.5 Pro e viu que a nova versão se esforça mais para usar a formatação de um jeito coerente na saída. Depois de testar com usuários, o Google entendeu que recursos como cabeçalhos e textos em negrito são muito importantes para quem usa a ferramenta.

Outra coisa que a IA fez durante o teste foi responder a uma pergunta de teste de longa duração com precisão. A pergunta era: “Será que a cor seria chamada de ‘magenta’ se a cidade de Magenta não existisse?”. A resposta foi um claro “não”. Vale lembrar que o Claude, em 2023, não se sentiu seguro para responder essa questão.

O Gemini 2.5 Pro já está disponível no Vertex AI e no AI Studio. Você também encontra uma prévia dele no app do Gemini.