O Google falou sobre uma grande atualização para o Gemini 2.5 Pro. Essa novidade corrige certos problemas da versão anterior, conhecida como I/O Edition ou 05-06, que tinha foco na atualização de codificação.
Segundo o Google, o upgrade gera códigos de um jeito bem melhor que a versão antiga. Ele alcançou uma pontuação alta de 82,2% no teste de benchmark Aider Polyglot. Com esses valores, o Gemini 2.5 Pro parece superar o que as concorrentes como OpenAI, Anthropic e DeepSeek têm de melhor, e com bastante folga.
O que mudou e quando chega?
Enquanto o Gemini 2.5 Flash foi liberado rápido para todo mundo, parece que o 2.5 Pro não seguirá o mesmo caminho. As atualizações anteriores do sistema de inteligência artificial foram criticadas por não deixarem o desempenho ideal para todos.
Logan Kilpatrick, do Google, falou no X que a empresa levou os feedbacks a sério. Ele disse que o novo update “fecha a lacuna da atualização 03-25”, indicando que teremos uma IA mais criativa e com melhor formatação de respostas, como aponta o ArsTechnica.
- A versão 06-05 suporta orçamentos de pensamento que podem ser configurados para desenvolvedores.
- Eles esperam que a atualização se torne um “lançamento estável de longo prazo”.
- A expectativa é que a atualização possa ser liberada para todos em algumas semanas.
Testes mostram a força do Gemini
O Google valoriza muito os testes feitos pelos usuários do LMArena e WebDevArena. Nesses testes, é possível comparar as respostas de cada modelo de linguagem grande (LLM) lado a lado sem saber qual é qual, algo como um teste cego.
No LMArena, o Gemini teve um salto de 24 pontos, e no WebDevArena, foram 35 pontos a mais. Como o Gemini Pro já estava na liderança, essa vantagem só aumentou, reforçando sua posição no mercado.
O ArsTechnica testou o Gemini 2.5 Pro e viu que a nova versão se esforça mais para usar a formatação de um jeito coerente na saída. Depois de testar com usuários, o Google entendeu que recursos como cabeçalhos e textos em negrito são muito importantes para quem usa a ferramenta.
Outra coisa que a IA fez durante o teste foi responder a uma pergunta de teste de longa duração com precisão. A pergunta era: “Será que a cor seria chamada de ‘magenta’ se a cidade de Magenta não existisse?”. A resposta foi um claro “não”. Vale lembrar que o Claude, em 2023, não se sentiu seguro para responder essa questão.
O Gemini 2.5 Pro já está disponível no Vertex AI e no AI Studio. Você também encontra uma prévia dele no app do Gemini.