英伟达交付CPU Vera:专为智能体AI设计;甲骨文承诺部署数十万颗

2026年05月19日 14:55
本文共计1155个字,预计阅读时长4分钟。
来源/财联社 责编/爱力方

《科创板日报》5月19日讯(编辑 宋子乔) 当地时间5月18日,英伟达正式宣布,其首款专为Agentic AI(智能体AI)设计的CPU——Vera,已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付

image

这款在今年3月GTC大会上亮相的重磅芯片,正式从英伟达的实验室走向了生产前线,首批交付过程充满了硅谷特有的仪式感。

上周五,英伟达副总裁伊恩•巴克亲自“开车送货”,第一站是Anthropic位于旧金山SoMa区的办公室,其计算负责人詹姆斯•布拉德伯里接收了服务器;在OpenAI的总部,巴克甚至掏出螺丝刀,当场打开机箱盖展示内部结构;当天行程的终点是帕洛阿尔托的SpaceX AI办公室,埃隆•马斯克亲自签收,并在现场详细询问了核心数量、内存布局及散热方案,SpaceX AI正计划将Vera用于强化学习工作负载与智能体仿真管线。

image

image

image

本周一,甲骨文产品管理负责人卡兰•巴塔在接收现场透露,“甲骨文云基础设施(OCI)计划从2026年开始部署数十万颗英伟达Vera CPU。Agentic AI需要在大规模下维持持续性能,Vera的架构专为高吞吐推理设计,这正是我们为下一代企业AI提供动力所需的效率。”

image

Agent AI并非仅靠GPU运行。每个代理沙箱、每次工具调用、每个编排层、每次长上下文检索操作都需要CPU处理。

Vera旨在满足Agent AI对CPU的需求,黄仁勋在本届GTC大会上将其定位为公司"下一个数十亿美元级业务"

与传统CPU设计追求“核心数量”最大化不同,Vera专为高吞吐推理、工具调用及代码生成设计。它搭载了88个英伟达自研的奥林巴斯(Olympus)核心,满载情况下单核性能较前代Grace提升50%,内存带宽高达1.2 TB/s,同时支持FP8精度,可直接承接AI推理与强化学习任务,无需GPU中转数据,可大幅提升AI流水线整体效率。

黄仁勋曾指出,当企业坐拥价值500亿美元的GPU时,绝不能让它们因为CPU处理速度慢而闲置。Vera存在的意义,就是当AI智能体需要同时处理规划任务、检索长上下文或调用API时,以极致的单线程性能和能效,让昂贵的GPU满负荷运转。

另外,Vera不仅是独立的CPU产品,它还将作为即将发布的Vera Rubin超级芯片平台的主机处理器,通过NVLink-C2C与两颗Rubin GPU配对,形成统一内存架构,以更高的能效为AI工厂供能。这种“CPU+GPU”异构协同的全栈AI算力方案,有望推动英伟达从单一GPU厂商向全栈AI计算平台提供商转型。

英伟达表示,Vera的高速核心与互连设计能够以传统基础设施两倍的能效,完成向GPU馈送数据所需的调度、控制与数据搬移工作

来源:英伟达重磅CPU Vera交付:专为智能体AI设计 甲骨文承诺部署数十万颗 | 财联社

声明:本文来自财联社,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/