O Google anunciou nesta terça-feira (24) o TurboQuant, uma nova tecnologia que promete resolver um dos maiores problemas das inteligências artificiais: o alto consumo de memória. A novidade permite que os sistemas lembrem de conversas muito longas ocupando seis vezes menos espaço no hardware.
Na prática, isso mexe com o chamado KV Cache, que funciona como a memória de curto prazo dos chatbots. Hoje, quanto mais você conversa com uma IA, mais memória RAM ela exige, o que acaba deixando o serviço lento ou muito caro para as empresas manterem.
Com o TurboQuant, o Google consegue 'espremer' esses dados sem que a IA perca a precisão ou comece a inventar informações. A tecnologia utiliza cálculos matemáticos avançados para remover o peso morto dos arquivos, mantendo apenas o que é essencial para a resposta.
Nos testes realizados, a velocidade de processamento chegou a ser 8 vezes maior do que nos sistemas atuais. Isso significa que ferramentas como o Gemini podem ficar muito mais rápidas e eficientes para o usuário final em um futuro próximo.
Especialistas comparam a inovação ao avanço chinês da DeepSeek, que provou ser possível ter alta performance gastando menos com equipamentos pesados. O foco aqui é a economia de recursos durante o uso diário das ferramentas.
Apesar dos resultados impressionantes, a novidade ainda está em fase de laboratório e será detalhada em uma conferência de tecnologia em 2026. A expectativa é que, em breve, a tecnologia seja integrada aos sistemas de busca e assistentes virtuais do Google.







