Qwen3 这波更新真猛,一下子成了全球最强编程模型

   2025-07-28 kongyu520
核心提示:大模型的演进从未停歇。最近一段时间大家也看到了,国内外不同公司的模型,仍处在你追我赶的竞争态势当中。作为从业者,我观察到

大模型的演进从未停歇。最近一段时间大家也看到了,国内外不同公司的模型,仍处在你追我赶的竞争态势当中。作为从业者,我观察到两个重要趋势,和大家分享:

第一,各个模型在今年,尤其看重编程能力。几年前大模型刚开始进入大众视野时,大家喜欢对比文字水准,而现在则更关注编程能力。

第二,开源模型进步尤其快。虽然开源模型和头部的闭源模型相比还有些差距,但差距正在被一点点拉近。更别说,开源的性价比摆在那里,优势已经很明显了。

昨天,阿里发布了新一代专为编程场景打造的 Qwen3-Coder。它的预训练数据里,代码占比接近 70%。和之前的 Qwen 开源模型一样,这次也有多个版本,适配不同需求。

其中旗舰模型 Qwen3-Coder-480B-A35B-Instruct,采用 MoE 架构,总参数量 480B,激活参数 35B。模型原生支持 256K 上下文,然后通过 YaRN 扩展后可以达到 1M,上下文处理能力直接拉满。

SWE-bench 是目前 AI 圈里最有分量的编程能力测试之一。它不是让模型做选择题或者刷算法题,而是把 AI 丢进真实的开源项目里,看看能不能像一个靠谱的工程师那样定位问题、修复 bug。每个模型最后的表现,用实际修复成功率来打分。

下图是最新的 SWE-bench 数据,我们能够看到,Claude-Sonnet-4 和 Qwen3-Coder,成功率分别为 70.4%和 69.6%。这意味着 Qwen3-Coder 的编程能力,已经逼近最强的闭源模型。

作为对比,我们能够看到 的成功率只有 40%,我猜测,DeepSeek 下一代模型,肯定也会重点 Focus 在编程上。

图片

对于编程模型来说,除了实际的编程效果,还有几个很关键的因素值得关注。

首先是上下文能力。最近行业里经常讨论上下文工程,比如 Augment 这家公司,他们虽然没有自研模型,但通过上下文的优化,也能做出很不错的编程体验,这其实就说明了上下文窗口的重要性。

Qwen3‑Coder 这次把上下文扩展到 1M,对行业来说绝对是个大利好。

其次是速度。这个因素反而被大家提得比较少。但对程序员来说,编程更像是一种创作型的工作,需要长时间沉浸、保持心流。如果模型响应慢,创作的连续性就会被打断,体验会大打折扣。

我今天亲测后的感觉是,在输出无误的情况下,Qwen3‑Coder 是目前所有模型中,生成代码速度最快的。下面我没有加速,录一个真实的生成过程,你感受下速度。

最后是价格。Claude 的模型不用多说,效果确实好,但价格摆在那里。我们小公司有次跑任务,一看账单,70 美金,说实话还是有点肉疼,活生生成了模型刺客。而且不少时候,可能是提示词写的不准确,结果模型干了一堆无用功,钱也就白花了。

最近 Cursor 涨价的消息大家也看到了,归根结底还是因为 Claude 模型太贵。这次 Qwen3‑Coder 发布之后,模型层面终于有了一个性价比很高的平替。

Qwen3‑Coder 的 API 是按输入 Token 数阶梯定价的,而且最近还有优惠。你看看下面的价格对比,和 Claude Sonnet 4 相比,真的便宜太多了。

图片

国内因为种种原因没办法使用 Claude 模型的同学,现在完全不用纠结,可以直接上 Qwen3‑Coder,相关的 API 服务可以在阿里云旗下的百炼平台中找到。

想直接体验 Qwen3‑Coder 模型的话,可以使用他们的网页版服务:https://chat.qwen.ai/,左上角选择对应的模型就行。

你随便输入一个生成网页的提示词,就会理解这款模型的第一个优势:快。快且准。我仅仅是测试了前端的代码,它的生成效果,还是相当优秀,遵循指令的能力不错。

图片

接下来我放几个自己的测试案例。我一般不喜欢搞什么贪吃蛇游戏、计算器之类的老掉牙测试,这些东西到现在已经没什么参考价值了。

想真正测出一款模型的能力,还是得拉到真实的开发场景里试一试。不然,常见的那些小游戏和应用,模型八成早就练过一遍,很容易让人误判模型的能力。

我相信大家平时用这些模型,也很少会让它做个计算机,做个小游戏。更多还是在业务里用嘛。为了更直观的测试,我请 Qwen3-Coder 做了几个动画,大家看看。

如果你在做前端相关的工作,我相信这些动画一定会在真实场景中用得着。Qwen3-Coder 生成这些已经信手拈来。

ntent="t" style="-webkit-tap-highlight-color:transparent;color:rgb(0, 0, 0);font-size:22px;letter-spacing:0.544px;margin:0px;max-width:100%;outline:0px;padding:0px;text-align:left;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">ntent="t" style="-webkit-tap-highlight-color:transparent;margin:0px;max-width:100%;outline:0px;padding:0px;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">ntent="t" style="-webkit-tap-highlight-color:transparent;color:rgb(242, 91, 44);margin:0px;max-width:100%;outline:0px;padding:0px;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">#01

ntent="t" style="-webkit-tap-highlight-color:transparent;color:rgb(0, 0, 0);font-size:22px;letter-spacing:0.544px;margin:0px;max-width:100%;outline:0px;padding:0px;text-align:left;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">案例一:手风琴页面效果

提示词:

设计一个时尚且精致的网页手风琴图像展示组件。要求如下:

1、页面包含 6 张图片横向排列,初始状态下每张图片只展示一部分宽度。

2、当用户鼠标浮动到某张图片时,该图片展开为主图。其余自动收起到原始宽度。

3、每张图片上居中覆盖有标题文字,展开时标题居中显示,采用淡入动画。

4、整体风格要现代、优雅,适合用于作品集展示。

5、添加简单的过渡动画,视觉上更自然

6、使用 HTML + CSS + JavaScript 实现动画,确保响应式布局,并兼容主流浏览器。

图片

ntent="t" style="-webkit-tap-highlight-color:transparent;color:rgb(0, 0, 0);font-size:22px;letter-spacing:0.544px;margin:0px;max-width:100%;outline:0px;padding:0px;text-align:left;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">ntent="t" style="-webkit-tap-highlight-color:transparent;margin:0px;max-width:100%;outline:0px;padding:0px;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">ntent="t" style="-webkit-tap-highlight-color:transparent;color:rgb(242, 91, 44);margin:0px;max-width:100%;outline:0px;padding:0px;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">#02

ntent="t" style="-webkit-tap-highlight-color:transparent;color:rgb(0, 0, 0);font-size:22px;letter-spacing:0.544px;margin:0px;max-width:100%;outline:0px;padding:0px;text-align:left;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">案例二:计数器翻转动画

提示词:

请帮我创建一个网页,实现一个简洁美观的计数器组件。

具体要求如下:

1、页面背景为红色(或珊瑚色),居中显示一个白色圆角矩形容器;

2、容器内包含三个元素:左侧减号按钮「−」、中间数字「0」、右侧加号按钮「+」;

3、初始值为 0,点击「+」数字递增,点击「−」数字递减,不能小于 0;

4、当数字为 0 时,减号按钮变为灰色禁用状态;

5、鼠标悬停按钮时,显示为指针样式;

6、使用 HTML、CSS 和 JavaScript 实现,结构清晰,代码可维护;

7、风格参考现代 UI 设计,按钮与文字居中对齐,动画流畅自然;

8、采用 3D 转换技术,每点击一次「+」,白色圆角矩形容器水平向右翻转 180 度,每点击一次「−」,白色圆角矩形容器水平向左翻转 180 度,翻转时不显示数字,翻转结束后显示出数字。

图片

ntent="t" style="-webkit-tap-highlight-color:transparent;color:rgb(0, 0, 0);font-size:22px;letter-spacing:0.544px;margin:0px;max-width:100%;outline:0px;padding:0px;text-align:left;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">ntent="t" style="-webkit-tap-highlight-color:transparent;margin:0px;max-width:100%;outline:0px;padding:0px;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">ntent="t" style="-webkit-tap-highlight-color:transparent;color:rgb(242, 91, 44);margin:0px;max-width:100%;outline:0px;padding:0px;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">#03

ntent="t" style="-webkit-tap-highlight-color:transparent;color:rgb(0, 0, 0);font-size:22px;letter-spacing:0.544px;margin:0px;max-width:100%;outline:0px;padding:0px;text-align:left;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">案例三:鼠标悬停动画

提示词:

请帮我创建一个时尚风格的网页图文展示网格,参考以下要求:

1、页面包含一个 2x2 的图片展示网格,共四张图片;

2、图片四周有留白边框,整体排版整齐对称;

3、鼠标悬停到任意图片上时:

4、鼠标移开时蒙版和文字淡出;

5、整体风格现代、优雅,适合用于作品集或时尚类网页;

6、使用 HTML + CSS + JavaScript 实现,结构清晰,不依赖框架;

7、图片可以使用占位图(placeholder)或提供图片路径说明;

8、页面应自适应不同屏幕宽度,支持响应式布局。

图片

上面的效果,我都是在 Qwen 的 ChatBot 中生成的。这次,阿里还带来了基于 Gemini CLI 的 Qwen Code,这东西其实就是一个命令行里的编程 Agent。

它可以访问本地文件系统,也支持常用的终端命令,还能浏览网页,最近我在用类似的产品,还挺顺手。如果你还没体验过 Claude Code 或者 Gemini CLI,那可以试试 Qwen Code。体验基本一致。

我给没用过的同学说下怎么安装 Qwen Code。真的很好用。首先,确认下自己是不是已经安装了 Node.js 20 以上的版本,如果没有,去 Node.js 官网上获取相应的安装包,并一键安装。

紧接着,再在命令行中输入命令,安装 Node.js 的包管理工具 npm:

npm 搞定之后,再输入命令安装 Qwen Code:

前面两步,如果提示安装错误,那可能是权限不够。比如我的 Mac 电脑,就需要输入 sudo 来获取更高级的权限。如果这两步执行没问题,就代表着已经安装成功。你可以输入下面的版本查看命令来验证是否安装成功。

图片

拿到 API Key 后,要在 Terminal 中设置对应的环境变量。注意,第一行命中,要把引号内的说明替换为自己的 API KEY。整体安装和配置都非常简单,这些在 Qwen  Code 的 GitHub 页面有具体的说明。或者你安装不成功,也可以给我留言,我帮你解决。

环境变量配置好后,输入 qwen 的命令就打开 Qwen Code。如下图,出来这个页面,也就代表你已经可以用 Qwen Code 这个基于 Terminal 的终端了。

我们可以用自然语言下个任务,它可以自动执行,并全自动的完成。这一点非常酷。

图片

我前两天看到 AI 创业公司 Every 的 CEO 说,他自己已经把类似 Qwen Code 的工具,当成一个日常高频使用的生产力工具。

因为 Qwen Code 可以访问我们的文件,所以,让 Qwen Code 来分析会议纪要,分析我们某个文件夹下的所有文件,都比单纯的 ChatBot 体验更好。

图片

Qwen3-Coder 的发布正值大模型代码助手快速发展的行业浪潮之中。

今年我们能看到,包括 Cursor、Windsurf、Devin、Lovable 在内的 AI 编程工具,都受到了用户和资本的追捧,国内几个大公司也都在做各自的 Coding 产品,大模型正在成为程序员的新型生产力工具。

但过去这段时间,所有的编程工具,都还是深度依赖 Claude 这样的头部闭源模型。Windsurf 之前还被限制接入 Claude 模型,这对他们带来了不小的麻烦。

这次,Qwen3-Coder 的发布,无疑对于行业是个好事,至少大家多了一个可以匹敌 Claude,且还开源、便宜的模型出来。

作为千问系列里第一个专门面向编程任务的旗舰模型,Qwen3-Coder 支持 358 种编程语言,并且在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上都取得了开源模型的 SOTA 效果。

比起之前 2.5 时代的小步快跑,这次 Qwen3-Coder 更像是一个明确的信号,阿里也开始在代码生成领域全力以赴做长期投入。

Qwen3-Coder,会成为阿里在代码生成领域的一个重要里程碑。

 
举报收藏 0打赏 0评论 0
 
更多>同类资讯
  • kongyu
    加关注0
  • 没有留下签名~~
推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号