国产大模型再加速,智谱 GLM-4.5 强势来袭
- AI
- 2025-07-29
- 51热度
国产大模型厂商的开源进程持续加速,近日,智谱正式推出最新旗舰模型 GLM-4.5,宣称是“专为 Agent 应用打造的基础模型”。
秉持开源原则,GLM-4.5 已在 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License,商用无虞。此次发布的 GLM-4.5 有两个版本,均采用混合专家(MoE)架构。GLM-4.5 总参数量 3550 亿,激活参数 320 亿;GLM-4.5-Air 总参数量 1060 亿,激活参数 120 亿。二者都支持混合推理模式,有用于复杂推理和工具使用的思考模式,以及即时响应的非思考模式。而且,API 调用价格极具竞争力,输入低至 0.8 元/百万 tokens、输出 2 元/百万 tokens,高速版最高可达 100 tokens/秒。
GLM-4.5 的技术亮点在于首次在单个模型中原生融合了推理、编码和智能体能力,打破了其他模型功能单一的局限。在“跑分”环节,智谱选取 12 个代表性评测基准,GLM-4.5 综合平均分全球模型第二、国产模型第一、开源模型第一。
实战测试中,智谱接入 Claude Code,让 GLM-4.5 与 Claude-4-Sonnet 等模型在 52 个编程开发任务上一决高下。结果显示,GLM-4.5 在工具调用可靠性和任务完成度方面表现出色,还公开了测试题目和 Agent 轨迹,尽显自信。
从 Demo 展示来看,GLM-4.5 能力非凡。在 z.ai 官网输入“做一个 Google 搜索网站”,它能生成可用的搜索引擎;打造的量子功能箱功能齐全;还能生成可点击缩放的 3D 地球页面。与传统 AI PPT 工具不同,它能自主搜索资料、配图,以 HTML 形式编写图文,支持多种比例。
开发者体验上,GLM-4.5 兼容 Claude Code 等主流代码智能体。技术内核方面,其参数量仅为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,但性能不打折,得益于更高的参数效率。GLM-4.5-Air 更是用较少参数在推理评测中逼近 Gemini 2.5 Flash 与 Claude 4 Sonnet。
性能提升源于强大的训练过程,GLM-4.5 和 GLM-4.5-Air 先在 15 万亿 token 通用数据上预训练,再在 8 万亿 token 特定领域数据上针对性训练,最后通过强化学习增强能力。此外,其成本和效率优势明显,API 已上线 BigModel.cn,普通用户可在智谱清言和 Z.ai 体验满血版。
值得一提的是,上个月 OpenAI 在报告中直接点名智谱,肯定其在全球 AI 竞赛中的显著进展。智谱增长势头稳定,模型迭代快、开源尺度大,成为“AI 六小龙”中首个启动 IPO 的玩家也就不足为奇了。