华为盘古Ultra大模型持续迭代,加速赋能多行业智能化
- 科技快讯
- 2026-01-23
- 83热度
华为盘古系列大模型的迭代动态持续受到科技圈关注,尤其是盘古Ultra及衍生版本的推出与落地,进一步展现了华为在AI大模型领域的技术实力。

作为华为重点布局的通用语言大模型,盘古Ultra自2025年4月发布以来,不断在模型性能、架构优化上实现突破,同时逐步拓展应用场景,从消费端交互到工业端生产,全方位赋能各行业智能化转型,形成了“技术迭代+场景落地”的双推进态势,成为国内自研大模型领域的重要标杆。
模型持续迭代升级,性能与架构实现双重突破
华为盘古Ultra大模型的核心优势的在于持续的技术迭代,其基础版本为千亿级通用语言大模型,拥有94层架构、总参数量达135B的超大稠密模型,针对超深千亿级大模型的训练稳定性问题,研发团队专门提出了新的稳定性架构和初始化方法,成功实现了在13.2T高质量数据上的全流程无loss突刺长稳训练。

在基础版本之后,华为快速推出参数规模达7180亿的盘古Ultra MoE模型,这是全流程在昇腾AI计算平台上训练的准万亿MoE模型。为解决超大规模MoE模型训练稳定性难题,研发团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化方法,实现了超过18TB数据的长期稳定训练。同时,通过一系列系统优化策略,在8192张昇腾NPU构建的大规模集群上将算力利用率(MFU)提升至50%,后续迭代中更是将万卡集群预训练MFU由30%大幅提升至41%。在核心性能上,盘古Ultra在AIME24、MATH-500、GPQA、MMLU-Pro等多项权威指标上,均实现了对同类模型的超越。此外,华为还推出盘古Pro MoE大模型,在参数量仅720亿的情况下,通过动态激活专家网络设计,性能可媲美千亿级模型,跻身国内同类模型前列。
多场景落地应用,兼顾消费端与工业端需求
华为盘古Ultra大模型的迭代,始终围绕“落地应用”展开,不仅在消费端实现场景渗透,更在工业端深度赋能,打破了AI大模型“重技术、轻落地”的困境。在消费端,盘古大模型已接入鸿蒙4.0操作系统,为“小艺”语音助手提供底层能力支撑,使其在智慧交互、高效生产力提升、个性化服务三个方向完成迭代升级。

优化后的“小艺”能够精准理解模糊意图和复杂指令,可辅助用户完成文案生成、图片二次创作、资讯摘要提取等操作,甚至能快速响应“找附近高分海鲜餐厅并推荐四人优惠套餐”这类复杂需求,成为用户日常使用的实用助手。在工业端,盘古大模型的应用场景更为广泛,在钢铁行业,它通过时序信息增强算法解析高炉冶炼的1400多个强耦合参数,实现炉温精准调控,帮助宝武钢铁等企业降低生产成本;在油气领域,与中国石油合作开发的地震解释AI大模型,将反演建模效率提升10倍,显著缩短项目周期;在化工领域,与云天化合作的气化炉优化模型,实现比煤耗削减1.33%,每年可节煤9100吨。此外,盘古矿山大模型已在100多个场景落地,逐步向煤矿、电力等领域推广复制。
技术落地背后的支撑,推动行业自主化发展
盘古Ultra大模型能够实现快速迭代与广泛落地,核心得益于华为“算力+技术+生态”的全方位支撑。算力方面,所有盘古系列大模型均基于昇腾AI计算平台训练,依托昇腾NPU构建的大规模计算集群,为超大规模模型的稳定训练提供了坚实保障,实现了“国产算力+国产模型”的全流程自主可控。
