面向下一代AI场景 英伟达Vera CPU落地 甲骨文敲定数十万部署规模

英伟达完成新一代定制CPU产品Vera的批量交付工作,这款硬件是行业首款针对智能体AI场景打造的专用处理器。首批交付对象包含多家全球头部科技企业,云计算服务商甲骨文公布明确的部署规划,后续会落地数十万颗Vera CPU,用于自家AI算力集群的搭建和运营。传统通用CPU的运行模式适配不了新式智能体AI的工作逻辑,Vera CPU的落地,填补AI基础设施的硬件适配空白。

普通大众日常接触的AI对话、自动办公、智能任务处理功能,都属于智能体AI的应用范围。这类AI程序和传统大模型的运行方式存在区别。传统大模型侧重单次内容生成,智能体AI需要持续处理数据、调用工具、循环执行任务、自主调整运行逻辑。整套工作流程会产生大量数据调度和频繁的指令切换,常规商用CPU的硬件架构,没办法长期稳定支撑这类高频次、高吞吐的运行需求。

市面上流通的通用CPU,设计初衷适配日常办公、云计算基础运算、常规程序运行等场景。硬件资源分配方式固定,单核处理效率和数据传输速度,匹配不了智能体AI的循环运算需求。企业搭建智能体AI服务,使用通用CPU会出现任务卡顿、运行延迟、能耗偏高、并发数量受限等问题,企业只能通过叠加硬件数量维持服务运转,整体运营成本会持续增加。

英伟达Vera CPU基于前代Grace CPU的研发经验迭代打造,硬件架构完全围绕智能体AI的运行逻辑调整。设备搭载八十八颗自研核心,核心性能针对高频指令处理、多任务循环、数据快速调度做优化。硬件单核处理能力对比前代产品提升百分之五十,整机的数据传输速度可以满足大规模智能体集群的并发运行需求。

这款CPU可以和英伟达GPU设备搭配使用,也可以独立承担AI调度、云计算编排、数据处理等工作。整套硬件组合可以简化AI集群的搭建结构,减少多余硬件设备的堆砌。企业搭建智能体AI服务,不用投入大量设备堆叠算力,单套Vera硬件架构就可以完成任务调度、数据流转、模型运行的整套流程,降低集群搭建的硬件成本。

本次拿到首批Vera CPU的企业,覆盖AI研发、云计算、航天科技等多个领域。除甲骨文之外,OpenAI、Anthropic、SpaceXAI等机构都参与首批硬件接收。这类企业长期深耕前沿AI技术研发,日常需要大规模硬件支撑智能体模型的训练和落地测试。首批硬件的交付,直接推进各类智能体AI应用的落地速度。

甲骨文公布的数十万颗部署规划,是目前Vera CPU最大的批量落地项目。甲骨文的云计算业务面向全球企业提供AI算力服务,现有算力集群主要服务传统AI模型运算。智能体AI的普及,需要全新的硬件架构支撑。大规模部署Vera CPU,可以让甲骨文的算力平台适配新一代AI应用,承接更多企业级智能体服务订单。

多数云计算厂商现阶段的算力设备,依旧以通用CPU和传统加速硬件为主。设备运行新式智能体程序时,资源利用率偏低,大量硬件性能处于闲置状态。企业使用这类算力服务,需要支付更高的费用,才能维持基础的智能体任务运转。Vera CPU的专属架构可以提升硬件资源利用率,同等硬件规模下,能够承载更多AI任务,企业的算力使用成本可以得到控制。

中小AI研发团队和普通企业,现阶段落地智能体应用会遇到明显的硬件门槛。市面适配的专用算力资源稀缺,通用算力运行效果达不到使用标准。英伟达Vera CPU的大规模商用落地,会带动整个行业的算力成本下调。后续云计算厂商会陆续更新硬件集群,市场会出现更多适配智能体AI的平价算力服务。

AI行业的发展重心已经从模型参数堆叠,转向实际任务落地和智能体应用普及。硬件作为基础支撑,架构标准需要匹配软件的迭代节奏。以往硬件更新跟随通用计算需求,行业没有针对智能体场景的专属CPU产品。Vera CPU的出现,统一了新一代AI硬件的适配标准,让智能体AI的训练、测试、商用落地拥有对应的专属基础设施。

后续随着数十万颗Vera CPU在甲骨文集群落地,全球AI算力市场的供给结构会出现变动。适配智能体场景的专用算力占比会持续提升,传统通用算力的市场占比逐步收缩。各类自动化AI办公工具、自主任务处理程序、企业智能服务系统,都会依托全新硬件架构完成升级迭代,AI应用的实用性和运行效率会持续提升。