阿里重磅发布Qwen3-Coder:开源AI代码模型新标杆
- AI
- 9天前
- 22热度
7月23日,阿里全新开源代码模型Qwen3-Coder正式亮相,这一消息瞬间在AI开源社区激起千层浪,引发广泛关注与热议。
Qwen3-Coder:强大参数与卓越性能并存
此次发布的Qwen3-Coder拥有多个尺寸版本,此次登场的是最强版本——Qwen3-Coder-480B-A35B-Instruct(以下简称Qwen3-Coder)。它作为一款混合专家(MoE)模型,总参数量高达4800亿,激活参数为350亿。在上下文支持方面,原生可支持256K token,还能通过YaRN扩展至高达1百万token,并且支持多达358种编程语言,展现出强大的多语言处理能力。
由于Qwen3系列模型的整体调整,Qwen3-Coder仅支持非思考模式,不生成思考过程。在注意力机制上,它采用了分组查询注意力(GQA)方案,配备96个查询(Q)注意力头和8个键/值(KV)注意力头,拥有160个专家,其中8个专家被激活,这种设计使得模型在处理代码任务时能够更加高效精准。
精心打磨:预训练与后训练双管齐下
在预训练阶段,研究团队从数据、上下文、合成数据三个不同维度进行扩展(scaling),全方位提升模型的代码能力。通过丰富多样的数据输入,让模型接触到更广泛的代码场景和模式,从而增强其对代码的理解和生成能力。
后训练阶段同样至关重要,研究团队选择在更丰富的真实代码任务上扩展代码强化学习(Code RL)训练。他们通过自动扩展测试样例,构造出大量高质量的训练实例,成功释放了强化学习的潜力。这一举措不仅显著提升了代码执行成功率,还对其他任务带来了积极增益,使得模型在处理复杂代码任务时更加得心应手。
实力见证:开源模型中的SOTA
此前,网友就挖掘出阿里团队在代码中对Qwen3-Coder的介绍:“Qwen3-Coder-480B-A35B-Instruct是一个强大的编码专用语言模型,在代码生成、工具使用和代理任务方面表现出色。”而实际测试也验证了这一描述。
阿里表示,该模型“拥有卓越的代码和代理能力”。在代理式编码、代理式浏览器使用和代理式工具使用上,Qwen3-Coder成为了开源模型的SOTA(State-of-the-Art,即当前最优水平),能够媲美Claude Sonnet 4,展现出强大的竞争力。
Qwen3-Coder一经推出便受到网友的热烈追捧,代码库上线仅一小时就收获了5.1k Star,足见其在开发者中的受欢迎程度。
配套工具与多元应用
除了强大的模型本身,阿里还推出并开源了一款用于代理式编程的命令行工具——Qwen Code。该工具基于Gemini Code进行二次开发,阿里团队对其提示词和工具调用协议进行了适配,使得Qwen Code能够最大程度激发Qwen3-Coder在代理式编程任务上的表现,为开发者提供了更加便捷高效的编程体验。
Qwen3-Coder还具有良好的兼容性,可以和AI社区优秀的编程工具结合使用,如Claude Code、Cline等。开发者也可以通过阿里云Model Studio调用Qwen3-Coder API,进一步拓展了模型的应用场景和使用方式。
目前,Qwen3-Coder网页版已经上线。笔者第一时间进行了体验,在只提供一句“克隆推特网页设计和UI”提示的情况下,Qwen3-Coder给出了相当不错的结果,生成的仿推特UI视觉元素丰富。相比之下,ChatGPT(免费版)给出的结果则较为简陋,虽然包含了文本和几个功能区域,但几乎没有视觉元素。
笔者还让Qwen3-Coder开发一个简单的网页版乒乓球游戏,仅用一句话提示:“开发一个可以在网站上运行的乒乓球游戏”。代码生成后直接在Artifact上无缝运行,整个过程不到20秒,效果惊艳。游戏不仅可以用键盘控制,支持两人对战,还自主添加了获胜规则。而ChatGPT生成的虽然也能运行,但在美观和完整性上远不及Qwen3-Coder。官方还展示了两段代码运行效果,分别是地球3D模拟和Flappy Bird游戏,进一步证明了Qwen3-Coder的强大能力。
Qwen3系列:持续迭代与模式调整
此次发布的Qwen3-Coder属于阿里Qwen3系列。三个月前,阿里发布了千问3(Qwen3)系列模型,包括两款混合专家MoE模型、六款密集模型和若干模型变种,例如后训练、FP8版本等等。其中的旗舰模型Qwen3-235B-A22B,总参数量高达2350亿(235B),激活参数为220亿(A22B),分布在94个深层网络层中。另外一个MoE模型Qwen3-30B-A3B尺寸较小,总参数量300亿,激活参数量30亿。
当时,Qwen3系列引入了一种混合方法,一个模型同时支持思考模式和非思考模式。但经过实践和与社区沟通后,阿里决定停止使用混合思维模式,取而代之的是分别训练Instruct和Thinking模型,以获得最佳质量。就在Qwen3-Coder发布的前一天,阿里更新了Qwen3系列,新模型名为Qwen3-235B-A22B-Instruct-2507(简称Qwen3-2507)。
Qwen3-2507在主流基准测试中表现优异。作为一款“没有思考能力”的开源模型,它在GPQA、AIME25和LiveCodeBench v6等测试中均超越了未开启思考模式的Claude Opus 4,展现出强大的性能和潜力。
开源力量:推动AI技术普惠发展
无论是Qwen3-Coder还是Qwen3-2507,再加上DeepSeek和Kimi等,都是AI开源社区宝贵的财富。在闭源模型各种刷榜的今天,它们难得地推动了大模型技术的普及化,为AI社区开发者和研究人员提供了强大的免费工具。
这些开源模型的广受欢迎让中国在全球AI开源领域占据了重要一席。它们不仅能促进AI技术的普惠发展,还能有效降低创新门槛,让更多开发者参与进来,共同构建一个更加开放和繁荣的AI生态系统。反过来,这些模型未来在产业应用、学术研究和人才培养等方面都将发挥不可估量的作用,进一步加速中国在AI领域的进步,为全球AI发展贡献中国力量。