美西时间6月2日上午9点半,旧金山Fort Mason Center,微软CEO萨提亚·纳德拉站上Build 2026开发者大会的舞台。当他按下遥控器的那一刻,整个科技圈意识到一件事——过去40年我们熟悉的Windows,可能要在今天被重新定义了。
这场微软自2016年以来首次离开西雅图的开发者大会,把几乎所有重磅发布都集中到了同一个关键词上——AI Agent(智能体)。从能让Agent在PC上安全跑起来的Windows新底座,到微软自研的MAI系列旗舰推理模型;从基于OpenClaw打造的”永不下班”助理Scout,到基于Android的Agent专用操作系统Project Solara——微软一口气把搜索、模型、操作系统、量子硬件、AI算力平台全线押上。
这不再是一场产品发布会,而是一次系统性的范式宣言。 微软在用Build 2026告诉世界:下一代计算的主入口,不再是App,而是Agent;下一代操作系统的服务对象,不再只是人,还有跑在系统里的成千上万的AI。
一、为什么是Agent?纳德拉把”Copilot”这个词彻底改写了
在Build 2026开幕主旨演讲中,纳德拉说了一段让在场开发者集体鼓掌的话:”我们正在把Copilot家族从同步助手,进化成能够跨关键领域执行长期任务的异步同事。”
翻译成大白话:以前Copilot是等你问它才回答,从今天起,Copilot会主动替你干活。
这种转变的背后,是微软对AI行业下一个阶段的判断。过去三年,大模型竞争主导了整个AI产业的发展方向——谁有最强的模型,谁就掌握话语权。但随着GPT、Claude、Gemini的能力逐渐趋同,单纯比拼模型分数已经意义有限。真正决定下一个十年胜负的,是谁能构建最强的AI生态。
而AI生态的核心载体,纳德拉认为是Agent。他在财报电话会上已经明确表态:未来用户不再需要亲自操作软件,而是向AI Agent描述目标,由AI Agent自动执行任务——从撰写邮件、安排会议,到编写代码、部署应用,大量工作流程都将交由Agent处理。
于是我们看到,微软在Build 2026上的战略版图已经明显超出聊天机器人和Copilot。微软如今同时在推进五条战线:AI模型(MAI系列)、Agent互联网(Web IQ)、智能体操作系统(Project Solara/Windows Agent工具链)、本地AI(Surface RTX Spark Dev Box)、量子计算硬件(Majorana 2芯片)。
换句话说,微软正在试图同时占据未来智能计算的五个关键入口:搜索入口、智能体入口、PC入口、云入口,以及潜在的量子计算入口。
一个时代的更迭,往往就在一场发布会之间。
二、MAI模型家族:微软终于不靠OpenAI了

如果说这次Build大会最让业内人士”意外”的发布,那一定是微软自研的MAI系列模型——一口气7款,覆盖推理、代码、图像、语音和转录等所有方向。
旗舰是MAI-Thinking-1。这是微软第一个真正意义上的旗舰级推理模型,采用稀疏MoE架构,35B active参数,总参数规模约1T,支持256K token上下文(大约能装下600页文档)。微软AI负责人穆斯塔法·苏莱曼在演讲中特别强调,这款模型没有使用任何第三方模型蒸馏,训练数据全部来自干净且合规授权的数据——这句话被业内普遍解读为对Anthropic和OpenAI的间接回应。
性能上,MAI-Thinking-1已经在Microsoft Foundry私有预览。苏莱曼透露,微软在麦肯锡的需求场景下优化后,这款自研模型成功超越了OpenAI的GPT-5-5,且成本效率提升了10倍。
第二款重点是MAI-Code-1-Flash。这是一个只有5B参数的轻量级Agentic Coding模型,发布即集成进GitHub Copilot和VS Code。微软官方数据:MAI-Code-1-Flash在SWE Bench Pro上达到51.2%,高于Claude Haiku 4.5的35.2%;在IF Bench精确指令跟随上领先28.9分,在Advanced IF上领先14.5分。
“理论token消耗较同定位大模型降低60%”——这是微软对这款编程模型的官方承诺。在Agentic Coding成为新一代开发者标配的当下,token成本就是核心竞争力。
除此之外,还有MAI-Transcribe(语音转录)、MAI-Voice(语音合成)、MAI-Image(图像生成)等4款模型同步在Microsoft Foundry上线。加上两款旗舰,整个MAI家族构成了微软”全栈自研”的模型矩阵。
微软这次非常坦诚:投资OpenAI 130亿美元、投资Anthropic 50亿美元(来源:雷科技《微软深夜摊牌了!自研模型AI「全靠自己」》),并不能成为自己不造模型的理由。 苏莱曼直言:”我们走的是Anthropic风格方向——企业、开发者、编码。”
三、Scout:基于OpenClaw的”永不下班”AI助理
如果说MAI模型是微软的”内功”,那Scout就是微软这次亮出的”外家拳”。
Scout是微软推出的”龙虾”级个人助理产品,基于近期备受关注的OpenClaw框架构建,与传统聊天机器人有本质区别——它不只是回答问题,更侧重于替代用户执行具体操作。
它的核心能力有五个:
第一,主动感知。 Scout能监测本地交通状况、用户日程安排,主动推荐出行、接孩子放学或赴约的最佳出发时间。它的”工作方式”更加接近真人——通过读取Teams聊天记录、会议记录和电子邮件内容,逐渐了解用户最看重哪些事情,并主动呈现相应信息。
第二,主动操作。 微软把Scout定位为”始终在线”的自治型工作代理,它能对工作空间内的文档进行主动操作——创建、编辑、搜索、整理Word、Excel、PowerPoint和代码文件。除此之外,Scout还能执行命令行操作,用于构建、测试和运行脚本,并通过分级权限控制机制来保障安全性。
第三,跨应用编排。 Scout与Outlook、OneDrive和Teams等365生态深度整合,能统一管理用户的电子邮件、日历、Teams消息、OneDrive文件以及各类会议活动。它还支持通过Playwright对浏览器进行自动化操控,完成网页导航、表单填写以及与各类Web应用的交互。
第四,子代理委派。 Scout具备”委派任务”的能力,可调用内部的子代理并行完成调研、代码审查以及多步骤业务流程等工作——这是真正意义上的多Agent协作。
第五,主动外呼。 Scout能主动给用户打电话——这在AI助理领域是突破性的体验创新。
目前已有3000名微软员工正在使用Scout,工程师利用它安排会议、处理文字工作、预定差旅行程。微软发现,许多人使用Scout的主要目的是更好地管理自身,处理好工作与个人生活。
值得注意的是,微软目前对Scout采取相对谨慎的推广策略:本周仅向美国Frontier客户开放桌面预览版,未来几个月内向少量客户开放功能受限的预览版本。微软副总裁Omar Shahine的表态很直白:”我们针对OpenClaw打造了一套专属接入流程,防范供应链风险及兼容性破坏等问题。我们在云端沙箱环境中运行OpenClaw,并且将其视为不受信任组件,因此它不会持有任何机密信息,也无法直接访问你的365数据。”
四、Project Solara:基于Android的Agent OS,微软造了一张”工卡”

如果说Scout是软件层的”Agent Assistant”,那Project Solara就是硬件层的”Agent OS”——而且这次微软做了一件让所有人意外的事:Project Solara的底层不是Windows,而是Android。
纳德拉在主旨演讲中把Project Solara带到了聚光灯下。它不是一款具体的消费电子产品,而是一套被定义为”从芯片到云的平台,一个用于打造独特智能体优先设备的交钥匙方案“的服务。直白地说,微软想给硬件厂商发一套低成本的工具包,让它们能够快速造出专门承载AI Agent的便携设备,从而让AI不再被关在个人电脑或者手机的方寸屏幕里。
在Build 2026现场亮相了两款概念设备:
第一款是桌面终端(Desk Concept),外观类似亚马逊Echo Show、谷歌Nest Hub等带屏智能音箱,用户可通过人脸识别解锁设备,并直接访问各类AI Agent。
第二款是智能胸牌(Badge Concept),它集成摄像头和指纹扫描模块,让人们看见了一个微小的终端如何具备感知环境的能力。这张卡片设备依托高通和联发科的硬件方案跑起来,可以独立完成身份认证、信息采集或环境交互。AI Agent可以在完全脱离手机的情况下连续运行。
Project Solara的命门在于”芯片到云平台”六个字背后的逻辑。对硬件厂商来说,开发Agent设备最头疼的往往不是工业设计,而是怎么把端侧的感知能力、设备管理能力与云端的推理、记忆、多模态模型全线对齐。Project Solara要做的,就是把这套对齐工程变成”开箱即用”的服务。
这也是微软第一次把Android拉进自己的核心生态版图——它意味着微软承认,在Agent时代,操作系统的边界已经不再由内核决定,而是由”能跑多少Agent”决定。
五、Surface RTX Spark Dev Box:本地跑千亿参数,让Agent在PC上安家
如果说Project Solara是为Agent而生的小型设备,那Surface RTX Spark Dev Box就是为Agent而生的”重型武器”。
这是微软和英伟达联手打造的”新一代本地AI开发设备”——搭载NVIDIA RTX Spark(N1X)芯片,能够本地运行千亿参数模型。
RTX Spark由英伟达与联发科合作设计,采用台积电3nm工艺,搭载一颗英伟达Blackwell架构GPU,拥有6144个CUDA核心和第五代Tensor Core,通过NVLink-C2C芯片互联技术与20核英伟达Grace CPU相连,配备高达128GB的统一内存。
黄仁勋通过连线参与了纳德拉的主题演讲,双方展示了一套覆盖Windows设备、本地计算、边缘部署到Azure云端的统一智能体AI技术栈。这意味着开发者从PC可以直接扩展到云端Agent部署——以前需要依赖云端的大模型推理任务,现在可以在本地PC上完成大部分工作。
微软和英伟达这一组合,本质上是在押注一个判断:Agent时代最稀缺的资源不是云端算力,而是本地化、低延迟、隐私安全的算力。 谁能解决端侧Agent的算力问题,谁就掌握了下一代计算平台的入场券。
六、Intelligent Terminal + WSL Containers:Windows正式”长出”Agent基因
如果说Surface RTX Spark Dev Box是给Agent装上”强劲心脏”,那Intelligent Terminal和WSL Containers就是给Windows本身”植入”Agent基因。
Intelligent Terminal——微软把智能体能力直接嵌入Windows Terminal,开发者无需切换聊天窗口,即可在终端环境中调用AI完成代码编写、调试、查询以及复杂任务执行。这意味着什么?以前你和AI聊需求、它给你一段代码、然后你复制到终端里跑——这中间的切换摩擦在Agent时代被彻底消除。
WSL Containers——微软将Linux容器能力直接整合进Windows系统。开发者未来可以直接在Windows环境中创建、管理和运行Linux容器,而智能体也能够更加高效地调用相关资源完成任务。微软甚至首次将Linux生态广泛使用的Coreutils工具集引入Windows环境。
表面上看,这是一次开发体验升级;但更深层的意义在于,微软正在让Windows成为更适合AI Agent工作的操作系统。
在Build大会上,微软Windows与设备业务负责人Pavan Davuluri说了一段很关键的话:”过去四十年,Windows的主要任务是运行应用程序。但在AI时代,微软认为越来越多任务将由智能体完成。未来用户不再需要亲自操作软件,而是向AI Agent描述目标,由AI Agent自动执行任务。”
在这种模式下,Windows服务的对象将不再只是人类用户,而是运行在系统中的大量AI Agent。
七、Web IQ:给AI Agent做的”搜索引擎”
除了操作系统层面的改造,微软还在搜索层面动了手——推出Web IQ。
Web IQ套件包含一系列AI原生Grounding API,被微软定义为”面向AI Agent的网络智能层“。它的目标并非服务传统网页搜索用户,而是直接为AI Agent、Copilot以及自动化智能体提供实时、可信、结构化的互联网信息。

简单来说:微软想做的,不再只是为人类用户搜索的Bing,而是给AI Agent搜索的”Agent版Bing”。
Web IQ本质上是一套为AI Agent提供实时互联网知识访问能力的服务层。它并非传统意义上的网页搜索,而是”帮助AI系统理解、推理并行动”的基础设施。
为什么要单独做一套”Agent版Bing”?因为AI Agent需要的是结构化、可信、可被推理的实时信息——传统搜索引擎返回的”十条蓝色链接”对人类友好,但对Agent不友好。Agent需要的是可以直接喂给推理引擎的”知识单元”。Web IQ的出现,意味着AI Agent第一次有了专属的”信息底座”。
八、MXC:AI Agent的”安全隔离舱”
Agent能干活,但也带来了前所未有的安全风险——Agent一旦接入业务系统,便成为新的权限入口与数据节点。如果Agent失控,造成的损失远大于一次错误的搜索结果。
针对这个问题,微软推出了Microsoft Execution Containers(MXC)——为AI Agent提供安全隔离机制。
MXC的核心思路是把Agent的执行环境”容器化”,让每个Agent都在自己的”沙箱”里运行,即使Agent行为异常,也不会直接访问到企业核心数据。
这和OpenClaw的设计哲学一脉相承。OpenClaw的核心安全原则就是”不信任任何第三方组件”,让Agent始终在受控环境中运行。微软显然已经把OpenClaw的安全理念内化到了自己的产品体系中。
九、Majorana 2:量子芯片登场,2029年实现商用
最后,还有一个看似与Agent无关、但极具战略意义的发布——新一代量子芯片Majorana 2。
Majorana 2是微软在量子计算领域的最新成果,微软在Build 2026上宣布,将拥有具备商业应用价值的量子计算机实用目标时间大幅提前至2029年。
量子计算与AI Agent有什么关系?简单来说,当Agent要处理超大规模决策、复杂系统模拟、密码学相关的任务时,传统计算架构会力不从心,量子计算的并行能力将成为Agent的”算力外挂”。微软这次把量子计算和AI Agent放在同一个发布会上,背后的潜台词是:未来的Agent生态,一定是”经典计算+量子计算”混合架构。
十、这场发布会,到底意味着什么?
如果用一句话总结Build 2026——这是微软对”下一代计算平台”的一次全面押注。
过去40年,PC操作系统的格局是”Windows一家独大+macOS小众高端+Linux技术圈专属”。但从今天开始,这个格局可能要彻底重写——因为”操作系统”这个词的定义本身在被重写。
以前我们说”操作系统”,指的是能跑应用程序的内核;以后我们说”操作系统”,指的是能跑AI Agent的底座。这两个”操作系统”,服务的对象完全不同:前者服务于人类的点击和键盘,后者服务于Agent的推理和执行。
微软在Build 2026上做的事情,本质上是用”Agent OS”重新定义Windows。 从这个角度看,Build 2026的真正意义,不是发布了几款新产品,而是微软把”Agent优先”这四个字,从战略口号变成了产品现实。
对于普通用户来说,这意味着三件事:
第一,你的电脑会越来越”主动”。 未来的Windows会主动帮你处理日程、邮件、文档,你不再需要主动去打开各种App。
第二,你的手机可能被”重新定义”。 当Agent可以在工牌、桌面终端、PC等任何设备上跑,传统的”以手机为中心”的设备格局可能会被打破。
第三,AI公司的竞争从”模型”升级到”生态”。 单纯比模型分数的意义越来越小,能构建最强Agent生态的公司才能赢得下一个十年。
当40年的Windows遇上AI Agent,操作系统这门生意的玩法,被微软这一场发布会彻底改写了。
写在最后:你准备好了吗?
Build 2026让我们看到,微软已经下定决心把Windows改造成Agent OS。这个过程不会一蹴而就,但方向已经不可逆转。
那么问题来了:
- 你现在的电脑,未来会跑着几个”Agent同事”?
- 你愿意为Agent版Windows多付多少钱?
- 如果微软真的把Windows开源部分Agent能力给Android,你最希望它跑到什么设备上?
欢迎在评论区聊聊你的看法。
参考资料:
- 微软Build 2026官方新闻(2026-06-02)
- 凤凰科技《Windows”梦中神机”来了,把你的PC变成Agent工位》
- 雷科技《微软深夜摊牌了!自研模型AI「全靠自己」》
- 网易科技《微软造了张”工卡”,AI从此不再困在手机里》
- 新浪财经《微软AI助理Scout来了,能主动给你打电话》
- 网易科技《微软推企业级AI代理Scout,直接在后台主动帮你干活》
- 钛媒体《微软Build火力全开:Web IQ要做智能体搜索的Bing》
- 36氪《微软Build 2026开发者大会定了!聚焦AI Agent与50款免费工具》



我要评论