阿里重磅发布Qwen3-Coder：开源AI代码模型新标杆

AI
9天前
22热度

7月23日，阿里全新开源代码模型Qwen3-Coder正式亮相，这一消息瞬间在AI开源社区激起千层浪，引发广泛关注与热议。

Qwen3-Coder：强大参数与卓越性能并存

此次发布的Qwen3-Coder拥有多个尺寸版本，此次登场的是最强版本——Qwen3-Coder-480B-A35B-Instruct（以下简称Qwen3-Coder）。它作为一款混合专家（MoE）模型，总参数量高达4800亿，激活参数为350亿。在上下文支持方面，原生可支持256K token，还能通过YaRN扩展至高达1百万token，并且支持多达358种编程语言，展现出强大的多语言处理能力。

由于Qwen3系列模型的整体调整，Qwen3-Coder仅支持非思考模式，不生成思考过程。在注意力机制上，它采用了分组查询注意力（GQA）方案，配备96个查询（Q）注意力头和8个键/值（KV）注意力头，拥有160个专家，其中8个专家被激活，这种设计使得模型在处理代码任务时能够更加高效精准。

精心打磨：预训练与后训练双管齐下

在预训练阶段，研究团队从数据、上下文、合成数据三个不同维度进行扩展（scaling），全方位提升模型的代码能力。通过丰富多样的数据输入，让模型接触到更广泛的代码场景和模式，从而增强其对代码的理解和生成能力。

后训练阶段同样至关重要，研究团队选择在更丰富的真实代码任务上扩展代码强化学习（Code RL）训练。他们通过自动扩展测试样例，构造出大量高质量的训练实例，成功释放了强化学习的潜力。这一举措不仅显著提升了代码执行成功率，还对其他任务带来了积极增益，使得模型在处理复杂代码任务时更加得心应手。

实力见证：开源模型中的SOTA

此前，网友就挖掘出阿里团队在代码中对Qwen3-Coder的介绍：“Qwen3-Coder-480B-A35B-Instruct是一个强大的编码专用语言模型，在代码生成、工具使用和代理任务方面表现出色。”而实际测试也验证了这一描述。

阿里表示，该模型“拥有卓越的代码和代理能力”。在代理式编码、代理式浏览器使用和代理式工具使用上，Qwen3-Coder成为了开源模型的SOTA（State-of-the-Art，即当前最优水平），能够媲美Claude Sonnet 4，展现出强大的竞争力。

Qwen3-Coder一经推出便受到网友的热烈追捧，代码库上线仅一小时就收获了5.1k Star，足见其在开发者中的受欢迎程度。

配套工具与多元应用

除了强大的模型本身，阿里还推出并开源了一款用于代理式编程的命令行工具——Qwen Code。该工具基于Gemini Code进行二次开发，阿里团队对其提示词和工具调用协议进行了适配，使得Qwen Code能够最大程度激发Qwen3-Coder在代理式编程任务上的表现，为开发者提供了更加便捷高效的编程体验。

Qwen3-Coder还具有良好的兼容性，可以和AI社区优秀的编程工具结合使用，如Claude Code、Cline等。开发者也可以通过阿里云Model Studio调用Qwen3-Coder API，进一步拓展了模型的应用场景和使用方式。

目前，Qwen3-Coder网页版已经上线。笔者第一时间进行了体验，在只提供一句“克隆推特网页设计和UI”提示的情况下，Qwen3-Coder给出了相当不错的结果，生成的仿推特UI视觉元素丰富。相比之下，ChatGPT（免费版）给出的结果则较为简陋，虽然包含了文本和几个功能区域，但几乎没有视觉元素。

笔者还让Qwen3-Coder开发一个简单的网页版乒乓球游戏，仅用一句话提示：“开发一个可以在网站上运行的乒乓球游戏”。代码生成后直接在Artifact上无缝运行，整个过程不到20秒，效果惊艳。游戏不仅可以用键盘控制，支持两人对战，还自主添加了获胜规则。而ChatGPT生成的虽然也能运行，但在美观和完整性上远不及Qwen3-Coder。官方还展示了两段代码运行效果，分别是地球3D模拟和Flappy Bird游戏，进一步证明了Qwen3-Coder的强大能力。

Qwen3系列：持续迭代与模式调整

此次发布的Qwen3-Coder属于阿里Qwen3系列。三个月前，阿里发布了千问3（Qwen3）系列模型，包括两款混合专家MoE模型、六款密集模型和若干模型变种，例如后训练、FP8版本等等。其中的旗舰模型Qwen3-235B-A22B，总参数量高达2350亿（235B），激活参数为220亿（A22B），分布在94个深层网络层中。另外一个MoE模型Qwen3-30B-A3B尺寸较小，总参数量300亿，激活参数量30亿。

当时，Qwen3系列引入了一种混合方法，一个模型同时支持思考模式和非思考模式。但经过实践和与社区沟通后，阿里决定停止使用混合思维模式，取而代之的是分别训练Instruct和Thinking模型，以获得最佳质量。就在Qwen3-Coder发布的前一天，阿里更新了Qwen3系列，新模型名为Qwen3-235B-A22B-Instruct-2507（简称Qwen3-2507）。

Qwen3-2507在主流基准测试中表现优异。作为一款“没有思考能力”的开源模型，它在GPQA、AIME25和LiveCodeBench v6等测试中均超越了未开启思考模式的Claude Opus 4，展现出强大的性能和潜力。

开源力量：推动AI技术普惠发展

无论是Qwen3-Coder还是Qwen3-2507，再加上DeepSeek和Kimi等，都是AI开源社区宝贵的财富。在闭源模型各种刷榜的今天，它们难得地推动了大模型技术的普及化，为AI社区开发者和研究人员提供了强大的免费工具。

这些开源模型的广受欢迎让中国在全球AI开源领域占据了重要一席。它们不仅能促进AI技术的普惠发展，还能有效降低创新门槛，让更多开发者参与进来，共同构建一个更加开放和繁荣的AI生态系统。反过来，这些模型未来在产业应用、学术研究和人才培养等方面都将发挥不可估量的作用，进一步加速中国在AI领域的进步，为全球AI发展贡献中国力量。