推理芯片市场生变,高通高内存战略挑战英伟达

人工智能芯片战场硝烟再起,移动芯片巨头高通携两款数据中心AI芯片正面迎战英伟达,一场围绕AI推理市场的主导权争夺战已经打响。

高通公司于2025年10月27日宣布推出AI200和AI250两款数据中心AI芯片,分别计划于2026年和2027年投入商用。这标志着主营移动芯片的高通正式进军数据中心市场,向​​英伟达在人工智能计算领域的主导地位发起挑战​​。

消息公布后,资本市场反应强烈,高通股价当日一度暴涨超​​20%​​,最终收盘涨幅约为11%。这表明投资者看好高通在AI芯片领域的增长潜力。

高内存容量与低推理成本,高通差异化竞争策略突围

在全球人工智能计算芯片市场,英伟达凭借强大的硬件性能及成熟的CUDA软件生态,长期稳居主导地位。面对这一市场格局,高通选择了一条差异化竞争策略。

高通不打训练战,而是将重点放在了AI推理市场。AI推理是指运行已经训练好的AI模型的过程,与模型训练相比,推理对功耗和成本更为敏感。

高通AI200单卡支持高达​​768GB的LPDDR内存​​,远超英伟达GB300芯片的288GB HBM3e内存。大内存容量使得高通芯片能够更高效地处理大型语言模型等AI推理任务。

2027年计划上市的AI250将引入“近存储计算”的全新内存架构。高通宣称该架构在有效内存带宽方面实现超过​​10倍的提升​​,同时显著降低功耗。

在部署灵活性方面,高通提供芯片、计算卡或整机系统不同选择。客户可按需采购,这种灵活的方案降低了企业尤其是中小企业的使用门槛。

从移动端到数据中心,高通的战略转型之路

高通目前的营收主要依赖以芯片产品为主的半导体业务,其中手机芯片贡献约七成的营收。随着智能手机市场增长放缓,高通迫切需要寻找新的增长点。

此次进军数据中心AI芯片市场,标志着高通加速战略转型。从移动设备芯片到数据中心AI芯片,是高通多元化战略的关键延伸。

高通技术规划、边缘解决方案与数据中心高级副总裁兼总经理Durga Malladi表示:“通过高通AI200和AI250,我们正在重新定义机柜级AI推理的可能性。”

高通在移动AI领域的经验为其进军数据中心提供了独特优势。这些新芯片基于高通的Hexagon神经处理单元技术,该技术已在高通智能手机和PC芯片的NPU架构中得到验证。

为强化自身在AI领域的产品布局,高通曾于2025年6月宣布以约​​24亿美元收购​​Alphawate Semi公司。这一收购有望扩大高通在数据中心和5G网络领域的产品实力。

破局者与守成者,AI芯片市场的竞争态势

英伟达在AI芯片市场尤其训练领域占据绝对主导地位,其GPU市占率超过90%。但高通的入局,选择了一个巧妙的突破口——AI推理市场。

AI推理市场正随着生成式AI应用的普及而爆发式增长。企业在这一过程中更关注“每Token成本”和“每Token能耗”等成本敏感指标。高通方案通过LPDDR内存替代英伟达使用的HBM内存,降低了内存成本。

高通的最大竞争力在于其成本效益。据称,AI200的​​每瓦算力是英伟达H200的1.5倍​​,这意味着在相同功耗下可以生成更多Token。对于大规模部署AI服务的企业来说,这一差异将显著影响运营成本。

高通还宣布将效仿英伟达和AMD的产品发布节奏,每年推出一款新的算力芯片。这表明高通正采取长期战略,而非短期试水。

不过,高通面临的挑战不容小觑。英伟达的CUDA生态系统已经形成强大的开发者粘性,而数据中心设备采购周期漫长、验证复杂。高通从产品发布到实现规模化营收仍需时间。

AI芯片未来竞争格局与行业影响

高通的入局为AI芯片市场带来了新的变数。目前,不仅高通,包括谷歌、亚马逊、微软等云服务商也在自研AI芯片,以降低对英伟达的依赖。

未来AI芯片市场将呈现​​GPU与ASIC长期共存、互补发展的格局​​。GPU凭借其通用性和完善生态,将继续主导大模型训练等需要灵活适配多算法的场景。

而ASIC则在数据中心大规模推理、边缘计算等场景加速渗透。随着AI应用从实验室走向产业化,算法逐渐固化,ASIC的成本和能效优势将进一步放大。

高通的市场策略聚焦云服务商和企业级客户,用于实时推理场景如聊天机器人、图像识别和推荐系统。其芯片兼容主流AI框架如PyTorch和TensorFlow,降低了开发者的使用门槛。

沙特AI公司Humain已承诺从2026年开始部署​​200兆瓦的高通系统​​,这一早期客户验证了高通的商业潜力。对于能源成本较高的地区,高通的低功耗方案具有明显吸引力。

高通的挑战不仅关乎自身,更可能重塑整个AI芯片行业。其专注推理、强调成本效益的策略,推动行业从单纯追求算力转向高效、低成本的每Token服务。

随着AI应用从训练走向大规模部署,推理市场的重要性日益凸显。高通的入局为行业提供了更多选择,也有望推动AI芯片技术向低功耗、低成本方向发展。未来,我们有理由期待一个更加多元化、健康发展的AI芯片生态圈。

对于企业用户而言,高通的进入意味着在未来部署AI服务时,将有可能​​大幅降低运营成本​​。而对于整个AI产业,竞争将加速技术创新,最终受益的将是整个行业生态与终端用户。

芯片型号
上市时间
内存容量
目标市场
技术亮点
高通AI200
2026年
768GB LPDDR内存

AI推理市场

高内存容量,低推理成本

高通AI250
2027年
未详细说明
AI推理市场

近存储计算架构,内存带宽提升10倍

英伟达GB300
已上市
288GB HBM3e内存

AI训练与推理
强大的通用GPU性能,成熟的CUDA生态

(表:高通与英伟达AI芯片主要参数对比)

数据中心AI芯片市场的竞争刚刚开始,好戏还在后头。