Nvidia lança CPU para agentes
Segundo a empresa, Vera é 1,8 vezes mais rápida do que processadores x86 para lidar com diversas cargas de trabalho em vários setores, gerando mais receita com tokens de data center

A Nvidia lançou uma CPU desenvolvida para agentes de IA, chamada Vera. O anúncio foi feito no NVIDIA GTC Taipei e os sistemas Vera estarão disponíveis através de fabricantes de sistemas e parceiros de nuvem a partir deste terceiro trimestre. A Nvidia Vera é uma nova classe de processadores que permite a conclusão de tarefas 1,8 vezes mais rápida em comparação com as CPUs x86, impulsionando diversas cargas de trabalho em vários setores — incluindo IA ativa, aprendizado por reforço e processamento de dados — gerando mais receita com tokens de data center.
Baseada no sucesso das CPUs Nvidia Grace, que já acumulam quase 2,5 milhões de unidades vendidas, a Vera eleva o desempenho e a eficiência energética da CPU a novos patamares para as cargas de trabalho de IA mais exigentes em data centers modernos — onde os agentes passam de responder a perguntas básicas a executar ações, rodar código, usar ferramentas e avaliar resultados.
Entre os clientes que estão explorando a CPU Vera estão a líder do setor financeiro NYSE, os laboratórios globais de IA Anthropic, OpenAI e SpaceXAI, e os hyperscalers ByteDance, CoreWeave, Lambda, Nebius, Nscale e Oracle Cloud Infrastructure (OCI). A Vera também está sendo integrada à infraestrutura de IA de fabricantes de sistemas líderes mundiais, como Dell Technologies, HPE, Lenovo e Supermicro, além de integradores de sistemas taiwaneses.
“Os agentes de IA serão os maiores usuários de computação”, diz Jensen Huang, fundador e CEO da NVIDIA. “Vera é a primeira CPU projetada para esse futuro — criada para executar IA com agentes em hiperescala com desempenho, eficiência e programabilidade extraordinários”.
“Os agentes de IA trazem um novo perfil de carga de trabalho, que exige mais desempenho, eficiência e flexibilidade da infraestrutura. O NVIDIA Vera responde a essa demanda ao oferecer uma CPU desenvolvida especificamente para esse contexto, permitindo ganhos relevantes em performance e eficiência energética nos data centers e preparando o terreno para uma nova era de inovação empresarial,” afirma Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
A Anthropic, empresa inovadora em IA por trás do Claude, está avaliando a adição da Vera para escalar cargas de trabalho de agentes que exigem muito da CPU. O supercluster OCI, com tecnologia NVIDIA Vera, representa a próxima fronteira na supercomputação de IA em hiperescala.
Uma CPU personalizada para a era dos agentes
A economia das fábricas de IA está mudando de núcleos por dólar para tokens por dólar, exigindo CPUs que executem tarefas de agente, processamento de dados e orquestração de forma mais rápida e eficiente. A Vera é alimentada pelo Olympus, um núcleo de CPU Nvidia personalizado, projetado para o trabalho de CPU por trás dessa mudança, desde os tempos de execução do Python e a execução de código em sandbox até a lógica de orquestração e os pipelines de análise.
Vera foi projetada para processar mais instruções, antecipar o comportamento de aplicativos e mover dados por um grande número de ambientes, consultas e tarefas de processamento de dados simultâneos — apresentando 88 núcleos Olympus, multithreading espacial e um subsistema de memória LPDDR5X que oferece até 1,2 TB/s de largura de banda. Isso ajuda os agentes a gastarem menos tempo esperando por etapas que consomem muita CPU e permite que as fábricas de IA mantenham os aceleradores em funcionamento.
A CPU Vera também pode ser implementada em toda a fábrica de IA — desde a infraestrutura de CPU independente até sistemas acelerados fortemente acoplados. A Vera ajuda as fábricas de IA a oferecer maior taxa de transferência de ponta a ponta e tempo de resposta mais rápido para os usuários, melhorando a capacidade de resposta e a eficiência em treinamento, inferência e execução de agentes.
A Vera serve como CPU host para as plataformas NVIDIA Vera Rubin por meio da tecnologia de interconexão NVIDIA NVLink™-C2C de segunda geração, que fornece até 1,8 TB/s de largura de banda coerente entre a CPU e a GPU. Ela amplia a Computação Confidencial da NVIDIA em escala de rack, protegendo cargas de trabalho com agentes.
O processador NVIDIA Vera BlueField-4 STX integra a tecnologia Vera com redes de alto desempenho, aceleração de armazenamento e segurança integrada ao silício para criar plataformas de dados nativas de IA com segurança integrada desde a concepção.
As CPUs Vera estão disponíveis em racks densos com refrigeração líquida para ambientes de IA Agêntica em larga escala e aprendizado por reforço, bem como em sistemas flexíveis de dois soquetes com refrigeração a ar para implantações corporativas, em nuvem, de processamento de dados e fábricas de IA.
Entre os principais fornecedores de infraestrutura que oferecem sistemas baseados na CPU Vera, estão Aivres, ASRock Rack, ASUS, Compal, Dell, Foxconn, GIGABYTE, HPE, Hyve Solutions, Inventec, Lenovo, MiTAC Computing, MSI, Pegatron, Quanta Cloud Technology (QCT), Supermicro, Wistron e Wiwynn. Os principais fabricantes de equipamentos originais (OEMs) — Dell, HPE, Lenovo e Supermicro — oferecerão a Vera em configurações de servidor com CPU independente, a primeira opção de CPU padrão além da arquitetura x86.
Entre os principais provedores de serviços em nuvem que planejam implementar CPUs Vera estão Akamai, ByteDance, Cloudflare, CoreWeave, Crusoe, Lambda, Nebius, Nscale, Oracle Cloud Infrastructure, Redpanda, Starburst, Together AI e Vultr.
