A NVIDIA anunciou uma nova família de placas gráficas chamada Rubin CPX, pensada para tarefas de inteligência artificial que lidam com contextos gigantescos. Segundo a empresa, a nova GPU foi desenhada para processar fluxos de vídeo e textos muito longos — e estará disponível comercialmente no final de 2026.
O que muda na arquitetura
Ao contrário das GPUs tradicionais, a Rubin CPX integra decodificadores e codificadores de vídeo junto com mecanismos de inferência para contexto longo, tudo num único chip. Isso permite trabalhar com sequências de contexto muito maiores sem perder velocidade em relação a modelos anteriores, como o NVIDIA GB300 NVL72.
Entre os destaques técnicos estão 128 GB de memória GDDR7 e um projeto de matriz otimizado que usa unidades de computação NVFP4, recursos que, segundo a NVIDIA, aumentam desempenho e eficiência energética.
Desempenho prático
A companhia diz que modelos de IA voltados a vídeo podem consumir até 1 milhão de tokens por hora, algo que exige mudanças na arquitetura tradicional das GPUs. Testes com empresas parceiras trouxeram exemplos concretos de ganho na prática.
A plataforma que agrupa tudo isso é chamada Vera Rubin NVL144 CPX. Ela funciona em conjunto com CPUs NVIDIA Vera e pode ser escalada usando infraestruturas de rede de alta performance, como a NVIDIA Quantum‑X800 InfiniBand ou a linha NVIDIA Spectrum‑X com SuperNICs ConnectX‑9.
Casos de uso
A Runway, que cria ferramentas de IA para efeitos visuais e cinema, relatou ganhos de velocidade, realismo e controle que beneficiaram tanto criadores independentes quanto grandes estúdios.
“Vemos o Rubin CPX como um grande salto em desempenho, suportando cargas de trabalho exigentes para desenvolver ferramentas criativas mais gerais e inteligentes. Isso significa que criadores — de artistas independentes a grandes estúdios — podem obter velocidade, realismo e controle sem precedentes em seu trabalho”, disse Cristóbal Valenzuela, CEO da Runway.
A empresa Magic, que desenvolve agentes de IA para automação de engenharia de software, informou que seus modelos básicos passaram a usar janelas de contexto de até 100 milhões de tokens para analisar código-fonte, histórico de interação e documentação sem ajustes, e que a Rubin CPX acelerou essas cargas de trabalho.
“Isso permite que os usuários orientem o agente no momento do teste por meio de conversas e acesso aos seus ambientes, nos aproximando de experiências autônomas de agente. Usar uma GPU como a NVIDIA Rubin CPX acelera significativamente nossas cargas de trabalho computacionais”, afirmou Eric Steinberger, CEO da Magic.
Comercialização e projeções
A NVIDIA também apresentou projeções comerciais para a plataforma, sugerindo que a estrutura poderia gerar até US$ 5 bilhões em receita de tokens para cada US$ 100 milhões investidos, de acordo com o material divulgado. Várias configurações da Rubin CPX foram anunciadas, incluindo o sistema Vera Rubin NVL144 CPX com opções de interconexão de alta performance.
Segundo a empresa, o lançamento público está previsto para o final de 2026, prazo em que a tecnologia deve começar a chegar ao mercado.
“A plataforma Vera Rubin marcará mais um salto na fronteira da computação de IA”, comentou Jensen Huang, fundador e CEO da NVIDIA.