刚刚，阿里重磅发布Qwen3.7！国产大模型王座再易主

5月20日，杭州西子湖畔。

2026阿里云峰会如期而至，但今年的画风明显不同。开场前30分钟，会场外已经排起长队，主会场座无虚席，过道、墙边、甚至后排摄像机位旁都站满了人——连投资人都全程站着看完了整场发布会。

这种久违的盛况，指向同一个焦点：阿里巴巴正式发布全新一代千问旗舰模型Qwen3.7-Max。

一出手就是王炸。

在全球权威评测机构Arena公布的最新一期盲测总榜中，Qwen3.7-Max总成绩位列国产第一，傲视Kimi-K2.6、DeepSeek-v4 Pro、GLM-5.1一众国产劲敌。另一家第三方机构Artificial Analysis给出的评分是56.6分，位列全球第五，与GPT、Claude、Gemini最强模型性能几乎持平。

这意味着，国产大模型正式站上了全球第一梯队。

更炸裂的还在后头。

峰会现场，阿里展示了一个让全场倒吸一口凉气的实测视频：Qwen3.7-Max被放置在平头哥新一代AI芯片真武M890上，工作空间里只有任务描述、SGLang Triton参考实现和评测脚本，没有任何人为干预。结果，模型连续编程35个小时，自主完成了一个生产级注意力内核算子的优化。经过优化的推理内核比官方参考实现取得了10倍加速。

这不是测试，这是工程创举。

35小时，432次内核评估，1158次工具调用——模型”化身”成一位资深工程师，从编写、编译、性能分析到迭代改进，全程自主完成。

一、Qwen3.7-Max牛在哪？

看懂Qwen3.7-Max，得先看懂它的定位：为Agent时代而生的通用智能体底座。

这次发布，千问打出了三张王牌。

第一张牌：编程智能体登顶

在Terminal Bench 2.0-Terminus评测中，Qwen3.7-Max取得最高69.7分，超过DeepSeek-v4-pro-Max、Claude-Opus 4.6等一众生猛对手，创下SOTA表现。在SWE-Pro、SWE-Multilingual等编程权威测评中同样全线飘红。

编程是Agent能力的试金石。能够自主写代码、修Bug、持续迭代的模型，才具备真正替代人类工程师的潜力。

第二张牌：推理能力全面超越

在GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench等核心推理评测中，Qwen3.7-Max均超越了Claude-Opus 4.6及所有国产模型。

指令遵循评测IFBench得分突破79.1分，创下新高。多语言理解和翻译在WMT24++、MAXIFE评测中保持领先。

第三张牌：通用智能体质的飞跃

在MCP-Atlas、MCP-Mark、Skillbench等现实能力评测中，Qwen3.7-Max表现优异，超越GLM-5.1、Kimi-K2.6等，创下国产新高。在Kernel Bench L3上展示了强大的GPU内核优化能力。

阿里集团通义大模型事业部负责人周靖人在发布会上表示：”我们正在身处Agentic时代。Qwen3.7-Max的目标不是刷榜，是成为下一代通用智能体的底座。”

二、实测：普通人能用它做什么？

光看数据不够，直接看实战。

场景一：从零开发桌面应用

如果你没有任何编程基础，想要自己做一个桌面番茄钟应用，在以前，你需要从零学写代码、配环境、修Bug，最后还要学打包成exe。

现在，只需一句指令：”帮我做一个桌面番茄钟应用。”

Qwen3.7-Max会先输出结构化的Markdown架构计划，确认技术栈（Python + PyQt）和功能范围后，迅速指挥工具开始执行。缺少环境？模型自动调度系统安装。全程不需要你操心任何技术细节。

遇到报错？模型展现惊艳的自我纠错能力——面对路径不匹配的连续报错，它在几秒内推理出替代命令方案，排除干扰，把精美的番茄钟稳稳弹到你桌面上。

想换个莫兰迪色系？一句话，模型精准理解审美需求并修改代码。

打包成exe发给朋友？同样一句话，模型自动安装打包依赖，生成干净的双击即用程序。

整个过程，普通人零基础操作，AI全程代劳。

场景二：复杂任务调度

下达指令：”使用opencli工具，帮我查查小红书上北京必吃的粤菜，附图片。”

Qwen3.7-Max从零开始”阅读”工具文档，自主摸索出正确的调用语法。遇到网络超时崩溃？模型自主推理出修改底层配置的绕路方案来延长等待时间。

几分钟后，满屏美食图片稳稳下载到本地文件夹。素材收集完毕，还能顺手生成PPT和在线文档，完成工作流闭环。

场景三：高阶文本技能调度

面对一段充满”首先其次最后”、”跨越时空的赞歌”等套路化词汇的游记，输入”去AI味”，Qwen3.7-Max准确识别核心诉求，调度系统内的Skill完成重写，并输出结构化复盘表格，从直接性、真实性等维度量化打分。

三个场景，从桌面软件开发，到陌生终端工具自主摸索，再到高阶文本技能调度——Qwen3.7-Max展现的不只是文本生成能力，还有高度成熟的Agent独立执行力。

三、阿里全栈体系爆发

Qwen3.7-Max的背后，是阿里”芯-云-模型-推理”全栈技术体系的集中爆发。

本次峰会，阿里同步推出了三款重磅产品：

1. 平头哥真武M890芯片

基于平头哥新一代AI芯片真武M890的128卡超节点服务器，搭载互联芯片ICN Switch 1.0，通信时延低至百纳秒级，可让128张AI芯片组成一台计算机，满足Agentic时代的并发推理和大模型训练需求。

2. 千问云

全新AI产品官网，提供Qwen、GLM、Kimi、DeepSeek、Wan、HappyHorse等150多款主流模型API，并将模型服务的核心能力封装为Skills和CLI工具，让Agent可以高效调用模型和开发AI应用。

阿里云副总裁刘伟光在现场表示：”我们正在把云的控制权交给智能体。”

3. 阿里云百炼平台

开放并池调度、上下文缓存等弹性技术，接入智谱、MiniMax等第三方模型，提供一站式模型服务。

这意味着，云计算的商业模式正在从”卖资源”向”卖智能”转型。Token日均收入5个月猛涨15倍，就是最直接的证明。

阿里云CTO李飞飞在峰会上进行了首秀，一口气面向Agent发布了32个新品。李飞飞表示：”Agentic AI时代，算力竞争正在从GPU单点突破转向CPU+GPU协同作战。阿里云已准备好为开发者提供从芯片到模型到应用的全栈支撑。”

四、三个月三连更，国产AI加速度

这一连串令人瞩目的成绩，是千问大模型近期狂飙的缩影。

千问旗舰模型的迭代周期已经卷到”月更”：

3月20日：Qwen3.5-Max-Preview发布
4月20日：Qwen3.6-Max-Preview发布
5月20日：Qwen3.7-Max正式发布

三个月，三代旗舰。对于用户来说，正在经历”幸福的烦恼”——刚熟悉完一代，新一代就来了。

能保证一个月推出一代旗舰模型，靠的绝非只是模型团队的”肝”。

阿里自今年3月成立ATH（Alibaba Token Hub）组织以来，逐渐形成了芯片、云、模型、应用全栈能力。其中，平头哥定制芯片提供极致的训练与推理效率，阿里云弹性算力让大规模预训练和部署无缝衔接，模型层的快速迭代又能直接反哺上层应用。

这种垂直整合压缩了沟通成本和工程损耗，让千问的研发节奏可以像互联网产品一样快速滚动。

千问按下AI加速度，本质是阿里全栈AI体系的爆发。

五、开源社区：全球开发者的默认底座

千问在走高频迭代路线的同时，没有放弃对开源社区的深耕。

上个月开源的Qwen3.6-27B和Qwen3.6-35B-A3B，成为”以小胜大”的代表作——登顶HuggingFace全球开源榜单，在主要编程基准上全面超越上代更大体量的Qwen3.5-397B-A17B，也大幅领先同等规模的稠密模型。

这些中小规模的千问模型，凭借极低的部署成本，提供了超越同尺寸甚至跨级挑战的性能，让全球开发者不自觉地将它们作为默认底座。

正如一位开发者所说：”阿里正带着千问飞速前进。开源这条赛道卷疯了，但最终是所有人的胜利。”

开源社区的口碑形成了强大的引力场。

上个月，Qwen3.6-Plus夺得全球知名大模型API调用平台OpenRouter日榜和周榜的双料冠军，并首创了单日单模型调用量突破1.4万亿Token的全球纪录。

Token正在成为解决问题的通用输入，而阿里通过千问牢牢抓住了这个流量入口。

六、AI格局重塑：国产力量正在改写规则

2026年，AI大模型的竞争正在发生根本性变化。

过去几年，国产大模型一直在追赶GPT、Claude的背影。但从今年开始，这个态势正在逆转。

Kimi K2.6以94.3分登顶Arena文本领域，DeepSeek V4以93.8分紧随其后，GPT-5被挤到第三。如今Qwen3.7-Max再下一城，登上全球第五、国产第一的宝座。

这不是某一个模型的胜利，而是国产AI全产业链的集体突围。

芯片层面，平头哥真武M890开始承担算力主角；云服务层面，阿里云完成从”卖服务器”到”卖智能”的转型；模型层面，千问家族从开源到旗舰全面覆盖；应用层面，Skills、CLI、Agent生态正在成型。

全栈能力的整合，让阿里成为了Agentic时代最具竞争力的中国玩家。

更关键的是，这种全栈壁垒优势，比单个模型的一次刷榜高分更难复制。

七、普通人能从中获得什么？

说了这么多，普通用户最关心的问题只有一个：我能用它做什么？

答案比你想象的要近。

5月22日，千问APP完成更新，用户将千问APP升级至6.9.7及以上版本后，点击底部胶囊或在下拉菜单中切换即可使用Qwen3.7-Max。

换句话说，今天你就能用上这台全球第五的模型。

免费。直接用。

对于普通用户而言，Qwen3.7-Max意味着：

写作不再是门槛：无论是工作报告、PPT大纲、朋友圈文案，一句话搞定全流程
编程不再是难题：想做个小工具？描述需求，AI帮你从代码到打包一站式完成
信息获取更高效：让Agent帮你检索、筛选、整理互联网信息，直接输出结论
多语言不再是障碍：翻译、跨语言沟通，模型帮你无缝衔接

对于开发者而言，Qwen3.7-Max意味着：

API调用更便捷：阿里云百炼平台提供一站式模型服务，150+模型任选
Agent开发更简单：Skills和CLI工具让智能体开发门槛大幅降低
开源底座更强大：中小规模模型即可达到以前超大规模模型的性能，本地部署成本大幅下降

对于企业而言，Qwen3.7-Max意味着：

智能化升级加速：Agent能力让业务流程自动化成为可能
算力成本优化：自研芯片+云平台垂直整合，性价比更高
全栈服务支持：从芯片到模型到应用到运维，阿里提供一站式解决方案

八、展望：Agent时代的王者之争

Qwen3.7-Max的发布，标志着国产大模型正式进入全球第一梯队。

但这只是开始。

Agentic时代的竞争，本质上是全栈能力的竞争。谁能提供从芯片到模型到应用到云服务的完整闭环，谁就能在下一个十年占据主导地位。

阿里的战略意图已经非常清晰：

芯片层：平头哥持续迭代，支撑算力底座
模型层：千问高频迭代，覆盖开源到旗舰全系列
云服务层：阿里云全面Agent化转型
应用层：Skills、CLI、Agent生态持续扩张

这不是单一产品的竞争，而是一个生态的竞争。

随着Qwen3.7-Max的发布，阿里已经率先吹响了Agent时代王者之争的号角。接下来的悬念是：其他玩家如何接招？

你怎么看Qwen3.7-Max的发布？它会成为你日常工作学习的首选工具吗？欢迎在评论区分享你的看法！

刚刚，阿里重磅发布Qwen3.7！国产大模型王座再易主

一、Qwen3.7-Max牛在哪？

二、实测：普通人能用它做什么？

三、阿里全栈体系爆发

四、三个月三连更，国产AI加速度

五、开源社区：全球开发者的默认底座

六、AI格局重塑：国产力量正在改写规则

七、普通人能从中获得什么？

八、展望：Agent时代的王者之争

龙主编

我要评论

刚刚，阿里重磅发布Qwen3.7！国产大模型王座再易主

一、Qwen3.7-Max牛在哪？

二、实测：普通人能用它做什么？

三、阿里全栈体系爆发

四、三个月三连更，国产AI加速度

五、开源社区：全球开发者的默认底座

六、AI格局重塑：国产力量正在改写规则

七、普通人能从中获得什么？

八、展望：Agent时代的王者之争

微信分享

龙主编

相关推荐

我要评论

扫码关注