5月20日,杭州西子湖畔。
2026阿里云峰会如期而至,但今年的画风明显不同。开场前30分钟,会场外已经排起长队,主会场座无虚席,过道、墙边、甚至后排摄像机位旁都站满了人——连投资人都全程站着看完了整场发布会。
这种久违的盛况,指向同一个焦点:阿里巴巴正式发布全新一代千问旗舰模型Qwen3.7-Max。
一出手就是王炸。
在全球权威评测机构Arena公布的最新一期盲测总榜中,Qwen3.7-Max总成绩位列国产第一,傲视Kimi-K2.6、DeepSeek-v4 Pro、GLM-5.1一众国产劲敌。另一家第三方机构Artificial Analysis给出的评分是56.6分,位列全球第五,与GPT、Claude、Gemini最强模型性能几乎持平。
这意味着,国产大模型正式站上了全球第一梯队。
更炸裂的还在后头。
峰会现场,阿里展示了一个让全场倒吸一口凉气的实测视频:Qwen3.7-Max被放置在平头哥新一代AI芯片真武M890上,工作空间里只有任务描述、SGLang Triton参考实现和评测脚本,没有任何人为干预。结果,模型连续编程35个小时,自主完成了一个生产级注意力内核算子的优化。经过优化的推理内核比官方参考实现取得了10倍加速。
这不是测试,这是工程创举。
35小时,432次内核评估,1158次工具调用——模型”化身”成一位资深工程师,从编写、编译、性能分析到迭代改进,全程自主完成。
一、Qwen3.7-Max牛在哪?
看懂Qwen3.7-Max,得先看懂它的定位:为Agent时代而生的通用智能体底座。
这次发布,千问打出了三张王牌。
第一张牌:编程智能体登顶
在Terminal Bench 2.0-Terminus评测中,Qwen3.7-Max取得最高69.7分,超过DeepSeek-v4-pro-Max、Claude-Opus 4.6等一众生猛对手,创下SOTA表现。在SWE-Pro、SWE-Multilingual等编程权威测评中同样全线飘红。

编程是Agent能力的试金石。能够自主写代码、修Bug、持续迭代的模型,才具备真正替代人类工程师的潜力。
第二张牌:推理能力全面超越
在GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench等核心推理评测中,Qwen3.7-Max均超越了Claude-Opus 4.6及所有国产模型。
指令遵循评测IFBench得分突破79.1分,创下新高。多语言理解和翻译在WMT24++、MAXIFE评测中保持领先。
第三张牌:通用智能体质的飞跃
在MCP-Atlas、MCP-Mark、Skillbench等现实能力评测中,Qwen3.7-Max表现优异,超越GLM-5.1、Kimi-K2.6等,创下国产新高。在Kernel Bench L3上展示了强大的GPU内核优化能力。
阿里集团通义大模型事业部负责人周靖人在发布会上表示:”我们正在身处Agentic时代。Qwen3.7-Max的目标不是刷榜,是成为下一代通用智能体的底座。”
二、实测:普通人能用它做什么?
光看数据不够,直接看实战。
场景一:从零开发桌面应用
如果你没有任何编程基础,想要自己做一个桌面番茄钟应用,在以前,你需要从零学写代码、配环境、修Bug,最后还要学打包成exe。
现在,只需一句指令:”帮我做一个桌面番茄钟应用。”
Qwen3.7-Max会先输出结构化的Markdown架构计划,确认技术栈(Python + PyQt)和功能范围后,迅速指挥工具开始执行。缺少环境?模型自动调度系统安装。全程不需要你操心任何技术细节。
遇到报错?模型展现惊艳的自我纠错能力——面对路径不匹配的连续报错,它在几秒内推理出替代命令方案,排除干扰,把精美的番茄钟稳稳弹到你桌面上。
想换个莫兰迪色系?一句话,模型精准理解审美需求并修改代码。
打包成exe发给朋友?同样一句话,模型自动安装打包依赖,生成干净的双击即用程序。
整个过程,普通人零基础操作,AI全程代劳。
场景二:复杂任务调度
下达指令:”使用opencli工具,帮我查查小红书上北京必吃的粤菜,附图片。”
Qwen3.7-Max从零开始”阅读”工具文档,自主摸索出正确的调用语法。遇到网络超时崩溃?模型自主推理出修改底层配置的绕路方案来延长等待时间。
几分钟后,满屏美食图片稳稳下载到本地文件夹。素材收集完毕,还能顺手生成PPT和在线文档,完成工作流闭环。
场景三:高阶文本技能调度
面对一段充满”首先其次最后”、”跨越时空的赞歌”等套路化词汇的游记,输入”去AI味”,Qwen3.7-Max准确识别核心诉求,调度系统内的Skill完成重写,并输出结构化复盘表格,从直接性、真实性等维度量化打分。
三个场景,从桌面软件开发,到陌生终端工具自主摸索,再到高阶文本技能调度——Qwen3.7-Max展现的不只是文本生成能力,还有高度成熟的Agent独立执行力。
三、阿里全栈体系爆发
Qwen3.7-Max的背后,是阿里”芯-云-模型-推理”全栈技术体系的集中爆发。
本次峰会,阿里同步推出了三款重磅产品:

1. 平头哥真武M890芯片
基于平头哥新一代AI芯片真武M890的128卡超节点服务器,搭载互联芯片ICN Switch 1.0,通信时延低至百纳秒级,可让128张AI芯片组成一台计算机,满足Agentic时代的并发推理和大模型训练需求。
2. 千问云
全新AI产品官网,提供Qwen、GLM、Kimi、DeepSeek、Wan、HappyHorse等150多款主流模型API,并将模型服务的核心能力封装为Skills和CLI工具,让Agent可以高效调用模型和开发AI应用。
阿里云副总裁刘伟光在现场表示:”我们正在把云的控制权交给智能体。”
3. 阿里云百炼平台
开放并池调度、上下文缓存等弹性技术,接入智谱、MiniMax等第三方模型,提供一站式模型服务。
这意味着,云计算的商业模式正在从”卖资源”向”卖智能”转型。Token日均收入5个月猛涨15倍,就是最直接的证明。
阿里云CTO李飞飞在峰会上进行了首秀,一口气面向Agent发布了32个新品。李飞飞表示:”Agentic AI时代,算力竞争正在从GPU单点突破转向CPU+GPU协同作战。阿里云已准备好为开发者提供从芯片到模型到应用的全栈支撑。”
四、三个月三连更,国产AI加速度
这一连串令人瞩目的成绩,是千问大模型近期狂飙的缩影。
千问旗舰模型的迭代周期已经卷到”月更”:
- 3月20日:Qwen3.5-Max-Preview发布
- 4月20日:Qwen3.6-Max-Preview发布
- 5月20日:Qwen3.7-Max正式发布
三个月,三代旗舰。对于用户来说,正在经历”幸福的烦恼”——刚熟悉完一代,新一代就来了。
能保证一个月推出一代旗舰模型,靠的绝非只是模型团队的”肝”。
阿里自今年3月成立ATH(Alibaba Token Hub)组织以来,逐渐形成了芯片、云、模型、应用全栈能力。其中,平头哥定制芯片提供极致的训练与推理效率,阿里云弹性算力让大规模预训练和部署无缝衔接,模型层的快速迭代又能直接反哺上层应用。
这种垂直整合压缩了沟通成本和工程损耗,让千问的研发节奏可以像互联网产品一样快速滚动。
千问按下AI加速度,本质是阿里全栈AI体系的爆发。
五、开源社区:全球开发者的默认底座
千问在走高频迭代路线的同时,没有放弃对开源社区的深耕。
上个月开源的Qwen3.6-27B和Qwen3.6-35B-A3B,成为”以小胜大”的代表作——登顶HuggingFace全球开源榜单,在主要编程基准上全面超越上代更大体量的Qwen3.5-397B-A17B,也大幅领先同等规模的稠密模型。
这些中小规模的千问模型,凭借极低的部署成本,提供了超越同尺寸甚至跨级挑战的性能,让全球开发者不自觉地将它们作为默认底座。
正如一位开发者所说:”阿里正带着千问飞速前进。开源这条赛道卷疯了,但最终是所有人的胜利。”
开源社区的口碑形成了强大的引力场。
上个月,Qwen3.6-Plus夺得全球知名大模型API调用平台OpenRouter日榜和周榜的双料冠军,并首创了单日单模型调用量突破1.4万亿Token的全球纪录。
Token正在成为解决问题的通用输入,而阿里通过千问牢牢抓住了这个流量入口。

六、AI格局重塑:国产力量正在改写规则
2026年,AI大模型的竞争正在发生根本性变化。
过去几年,国产大模型一直在追赶GPT、Claude的背影。但从今年开始,这个态势正在逆转。
Kimi K2.6以94.3分登顶Arena文本领域,DeepSeek V4以93.8分紧随其后,GPT-5被挤到第三。如今Qwen3.7-Max再下一城,登上全球第五、国产第一的宝座。
这不是某一个模型的胜利,而是国产AI全产业链的集体突围。
芯片层面,平头哥真武M890开始承担算力主角;云服务层面,阿里云完成从”卖服务器”到”卖智能”的转型;模型层面,千问家族从开源到旗舰全面覆盖;应用层面,Skills、CLI、Agent生态正在成型。
全栈能力的整合,让阿里成为了Agentic时代最具竞争力的中国玩家。
更关键的是,这种全栈壁垒优势,比单个模型的一次刷榜高分更难复制。
七、普通人能从中获得什么?
说了这么多,普通用户最关心的问题只有一个:我能用它做什么?
答案比你想象的要近。
5月22日,千问APP完成更新,用户将千问APP升级至6.9.7及以上版本后,点击底部胶囊或在下拉菜单中切换即可使用Qwen3.7-Max。
换句话说,今天你就能用上这台全球第五的模型。
免费。直接用。
对于普通用户而言,Qwen3.7-Max意味着:
- 写作不再是门槛:无论是工作报告、PPT大纲、朋友圈文案,一句话搞定全流程
- 编程不再是难题:想做个小工具?描述需求,AI帮你从代码到打包一站式完成
- 信息获取更高效:让Agent帮你检索、筛选、整理互联网信息,直接输出结论
- 多语言不再是障碍:翻译、跨语言沟通,模型帮你无缝衔接
对于开发者而言,Qwen3.7-Max意味着:
- API调用更便捷:阿里云百炼平台提供一站式模型服务,150+模型任选
- Agent开发更简单:Skills和CLI工具让智能体开发门槛大幅降低
- 开源底座更强大:中小规模模型即可达到以前超大规模模型的性能,本地部署成本大幅下降
对于企业而言,Qwen3.7-Max意味着:
- 智能化升级加速:Agent能力让业务流程自动化成为可能
- 算力成本优化:自研芯片+云平台垂直整合,性价比更高
- 全栈服务支持:从芯片到模型到应用到运维,阿里提供一站式解决方案
八、展望:Agent时代的王者之争
Qwen3.7-Max的发布,标志着国产大模型正式进入全球第一梯队。
但这只是开始。
Agentic时代的竞争,本质上是全栈能力的竞争。谁能提供从芯片到模型到应用到云服务的完整闭环,谁就能在下一个十年占据主导地位。
阿里的战略意图已经非常清晰:
- 芯片层:平头哥持续迭代,支撑算力底座
- 模型层:千问高频迭代,覆盖开源到旗舰全系列
- 云服务层:阿里云全面Agent化转型
- 应用层:Skills、CLI、Agent生态持续扩张
这不是单一产品的竞争,而是一个生态的竞争。
随着Qwen3.7-Max的发布,阿里已经率先吹响了Agent时代王者之争的号角。接下来的悬念是:其他玩家如何接招?
你怎么看Qwen3.7-Max的发布?它会成为你日常工作学习的首选工具吗?欢迎在评论区分享你的看法!



我要评论