2026年6月1日上午11点,中国台北流行音乐中心,黄仁勋穿着那件标志性的黑色皮夹克登台。
台下坐着的,有他特意请来的父母,有英伟达的核心客户,有来自全球70个分会场的数万名开发者,还有OpenAI、Anthropic、SpaceX的高管代表。这场长达近2小时的”GTC Taipei at COMPUTEX 2026″主题演讲,黄仁勋一开口就抛出了一个让整个科技圈重新审视英伟达的判断:”实用AI已经到来,Agentic AI时代全面爆发。”
从数据中心到PC,从云端到物理世界,从Vera Rubin全面量产到RTX Spark正式发布,黄仁勋用两个小时完成了一次系统性的范式宣言:英伟达不再是一家GPU公司,而是AI基础设施公司。
这场演讲的信息密度之高,在过去十年的GTC历史上几乎前所未有。黄仁勋一个人,把英伟达从GPU霸主的位置,直接推到了AI时代”卖水人”的王座上。
01 一场2小时的演讲,黄仁勋抛出了什么?
要理解这场GTC台北演讲的分量,得先理解一个数据:目前1GW等级的AI工厂,投资金额已经从200亿到300亿美元,涨到了500亿到600亿美元。黄仁勋预测,未来这个数字可能达到800亿到1000亿美元。
到2030年前,全球将新增超过100GW的AI工厂容量。这是一个什么概念?1GW大约相当于一座大型核电站的发电量,而100GW的AI工厂,意味着人类要把整个”工业革命的算力引擎”重新搭建一遍。
在这样的背景下,英伟达的角色发生了根本性变化。黄仁勋开宗明义:“客户不想再买电脑,他们想打造AI工厂。”
所以,这场2小时的演讲,黄仁勋只做了一件事:展示英伟达已经为Agentic AI时代准备好了全套的”水电煤”。
02 第一弹:Vera Rubin全面量产,7款芯片,机架组装从2小时压缩到5分钟
黄仁勋在演讲中宣布的第一个重磅消息,是Vera Rubin架构已全面进入量产阶段。
这个名字里有”两个女人”——Vera是黄仁勋母亲的名字,Rubin是著名天文学家Vera Rubin。这套架构凝聚了4万名工程师的研发力量,是英伟达迄今最具野心的产品。
它不是一个单一芯片,而是一个POD级(机柜级)的AI超算集群。具体由以下7款新芯片组成:
- Vera Rubin NVL72 GPU
- Vera CPU(首款独立服务器CPU)
- Groq 3 LPX
- BlueField-4 STX(存储芯片,带芯片级安全)
- Spectrum-6 SPX(基于CPO的光交换机)
- ConnectX-9 SuperNIC
- NVLink 6交换机
每块计算板上集成了6万亿个晶体管、超过1.8万个组件,采用台积电3nm制程、CoWoS-R和CoWoS-L封装。内存来自美光、SK海力士和三星的HBM4高带宽内存。

黄仁勋特别强调了一个工程亮点:全新设计的无缆化midplane,让18个计算托盘和9个NVLink交换器托架可以直接对接,单机架组装时间从Blackwell的2小时直接压缩到5分钟。在AI工厂这种”按GW算规模”的部署场景下,这种效率提升是革命性的。
供应链规模也直接翻倍:为Rubin搭建的供应链是Blackwell的两倍。英伟达官方透露,Vera Rubin产品将从2026年下半年开始由合作伙伴大规模出货。
03 第二弹:Vera CPU杀入服务器CPU市场,直接挑战Intel和AMD
如果说Vera Rubin是英伟达在GPU战场上的”老本行”,那么Vera CPU的发布,则是英伟达向Intel腹地发起的一次正面进攻。
Vera CPU是英伟达首款专门面向数据中心的独立微处理器,直接对标Intel Xeon系列、AMD Epyc系列,以及亚马逊Graviton等云厂商自研芯片。
核心参数:
- 88个自研Olympus核心,采用空间多线程技术
- LPDDR5X内存,带宽高达1.2TB/s
- 第二代NVLink-C2C互连,CPU到GPU一致性带宽最高1.8TB/s
- 相比x86 CPU,任务完成速度快1.8倍
黄仁勋在演讲中直言:”未来智能体的数量将远超人类,它们调用工具、访问数据库时对延迟极度没有耐心。为’人类’设计的传统CPU,天然不适配纳秒级的异构计算。”
这是一个被英伟达凭空创造出的全新巨大市场。
Vera CPU的杀手锏在真实工作负载中的表现:
- SQL数据库处理速度提升3倍
- 纽约证券交易所的实时流处理任务提升6倍
戴尔、惠普、联想将提供Vera独立CPU服务器配置。客户名单里,赫然写着OpenAI、Anthropic、SpaceX。
这是英伟达第一次,就CPU性能与行业现行标准展开正面比较。背后逻辑很清晰:随着AI工作负载重心从模型训练转向推理与服务部署,通用CPU的地位日益凸显,市场对英伟达GPU加速器是否仍不可或缺的疑虑也随之上升。Vera CPU,就是英伟达给出的答案。
04 第三弹:RTX Spark杀入PC市场,联发科+台积电一起上
如果说前两个发布还停留在”数据中心”的舒适区,那RTX Spark的发布,意味着英伟达正式向消费电子市场全面进军。
RTX Spark是一款专为AI PC设计的超级芯片,由英伟达、联发科、台积电三方联合开发:
- CPU:联发科定制的20核Arm处理器(外界代号N1X)
- GPU:基于Blackwell架构,6144个CUDA核心,支持FP4精度的第五代Tensor Cores
- 互连:NVLink-C2C芯片间互连,GPU和CPU共享内置内存
- 工艺:台积电3N(3nm)制程
黄仁勋的野心很直白:“英伟达将联手Windows重新定义PC,这是专为AI Agent设计的Windows平台。”
这款芯片将在2026年秋季面市,适用于笔记本和台式机,目标是整个Windows阵营。
天风国际证券分析师郭明錤分析:”根据供应链信息,未来两年基于N1X的设备出货量约为1000万台。产品仍属利基市场,针对需要设备端AI计算的资深用户。”
虽然1000万台听起来不算大,但这背后是Arm阵营向x86 PC市场进攻的号角。过去数十年,Windows PC市场由Intel、AMD等x86平台牢牢定义;在AI PC和个人AI Agent时代,英伟达与联发科的合作,正在改写这个格局。

05 第四弹:NVIDIA+Microsoft三年磨一剑,Windows不再运行应用,而是运行Agent
RTX Spark只是硬件。真正的杀手锏,是软件和生态。
6月2日晚,黄仁勋将再次登台,这次是与微软CEO纳德拉(Satya Nadella)同台,进一步披露NVIDIA与Microsoft合作的细节。
但在此之前,黄仁勋已经剧透了核心方向:
> “NVIDIA和Microsoft用了整整三年时间,从零重构PC的运作方式,就为了等这个Agent时刻。”
他抛出了一个足以改写整个消费电子格局的判断:“40年来PC的第一次重新发明,由NVIDIA和Microsoft联手完成。”
黄仁勋的逻辑链很清晰:既然未来十年的统一计算模式是Agent(模型+Harness+工具+Runtime),那么Agent不仅要跑在云端,也必须原生跑在每个人的PC上——能7×24小时不间断、本地沙箱化、连接本地或云端模型、看得见你、听得懂你、替你干活。
为此,PC的芯片和操作系统都得重做。
他类比40年前Windows之所以让PC走进千家万户,是因为做对了几件事:BIOS抽象、开放芯片组、运行时可加载驱动、多媒体API抽象层。今天Microsoft和NVIDIA要再做一次同样的事:新一代PC = 旧操作系统 + 大语言模型 + Agent Runtime。
这意味着Windows不再只是”运行应用的操作系统”,而是”运行Agent的操作系统“。而NVIDIA,是这套新OS底层硬件的联合定义者。
06 客户天团:OpenAI、Anthropic、SpaceX、比亚迪、吉利、小米
除了硬件,黄仁勋在演讲中还公布了一份长长的客户名单:
数据中心侧:
- OpenAI(首批Vera Rubin客户)
- Anthropic(首批Vera Rubin客户)
- SpaceX(首批Vera Rubin客户)
- 字节跳动
- 纽约证券交易所
- 戴尔、HPE、联想、超微(集成至AI服务器)
PC和消费侧:
- 联发科(RTX Spark定制CPU)
- 台积电(3nm代工)
自动驾驶与机器人侧:
- 比亚迪
- 吉利
- 极氪
- 小米
- 小马智行
- 宇树(H2 Plus人形机器人合作)
这份名单的覆盖范围,几乎画出了整个AI时代的产业版图。
07 战略升维:从GPU公司到AI基础设施公司
整场GTC台北演讲,黄仁勋反复强调的一个词,是“AI基础设施公司”(AI Infrastructure Company)。
“我们不再是GPU公司了,英伟达已经是全球最大的CPU制造商之一。”黄仁勋在演讲中说出这句话时,英伟达美股夜盘股价应声上涨2.7%。
为什么这个定位如此重要?
过去几年,全球AI产业的核心叙事是算力扩张。谁能获得更多高端GPU,谁就能更快训练大模型。但随着大模型能力不断提升,产业瓶颈正在发生变化:
- 训练仍然重要,但推理、Agent、多模态生成、自动驾驶仿真、机器人训练和企业级部署,正在成为新一轮基础设施需求的来源。
- 单一芯片性能不再是唯一指标,整体AI工厂效率才是。
- Throughput per Watt(每瓦吞吐量)
- Tokens per Watt(每瓦Token产出)
- Time to First Token(首次产出Token时间)
- 系统可靠度与利用率
这些指标将直接影响AI工厂的获利能力。黄仁勋用一个新公式总结了这个时代:

> Token = 新资产
> 数据中心 = Token工厂
> 算力效率 = 核心竞争力
这就是英伟达把Vera Rubin定位为”AI工厂底座”的原因。它不再是GPU升级,而是把CPU、GPU、网络、存储、安全和机柜架构整合为一个完整的AI工厂单元。
08 性能跃升:Vera Rubin的10倍Agent吞吐
具体到性能数据,英伟达官方给出的对比是:
> “Vera Rubin在大规模部署下,可提供10倍于Grace Blackwell的Agent吞吐能力。”
这个数字的意义在于:AI产业的重心,正在从训练转移到推理和服务。
过去,AI基础设施更多强调训练性能、浮点算力和GPU数量。而在Agentic AI时代,英伟达开始强调Agent吞吐、Token成本、任务完成速度和数据中心Token收入。
Vera Rubin的目标用户,不是”训练大模型的研究院”,而是”靠Agent赚钱的AI工厂“。
09 行业影响:Intel和AMD的真正焦虑来了
这场演讲最受冲击的,不是英伟达的竞争对手,而是长期主导PC和服务器市场的Intel与AMD。
Vera CPU的发布,意味着英伟达正式进入服务器CPU市场。Vera CPU比x86快1.8倍,这不是营销话术,而是英伟达在真实工作负载中给出的实测数据。
RTX Spark的发布,意味着英伟达向消费PC市场发起正面进攻。联发科+台积电+Windows的组合,直接挑战Intel+AMD+Windows的传统铁三角。
在2026年这个时间点,Intel和AMD的处境非常微妙:
- Intel正在努力追赶AI浪潮,但工艺制程和生态都在重建
- AMD虽然在数据中心GPU市场占据一席之地,但在CPU市场仍要直面Vera
- 而英伟达,通过Vera CPU + RTX Spark + Vera Rubin的三重组合,实现了从云到端的全栈覆盖
如果Vera CPU和RTX Spark能在2026年下半年顺利出货,英伟达将从”AI加速器供应商”升级为”AI时代的Intel“。
10 AI工厂经济学:算力就是营收
黄仁勋在演讲中给出了几个关键数据点,让”AI工厂”这个概念变得更加具体:
- 1GW AI工厂投资:200-300亿美元 → 500-600亿美元 → 可能达800-1000亿美元
- 2030年前全球新增AI工厂容量:超过100GW
- Vera Rubin机架组装时间:2小时 → 5分钟
- Vera Rubin供应链规模:是Blackwell的2倍
这些数字背后,是一个清晰的商业逻辑:AI工厂的价值已不只是数据中心,而是直接创造Token与收益的生产设施。
“算力就是营收”——黄仁勋在演讲中用这四个字总结了AI工厂经济学的核心。
对于英伟达来说,这意味着一个新的增长曲线:过去卖GPU,按芯片出货量算;未来卖AI工厂,按机柜、按GW、按Token计费。
11 一场演讲,三种产品,一个新时代
回过头来看这场GTC台北2026演讲,黄仁勋其实只讲了三件事:
第一,Vera Rubin全面量产——英伟达的”老本行”GPU,进入新的机柜级时代,10倍Agent吞吐,2小时机架组装压缩到5分钟,供应链规模翻倍。
第二,Vera CPU杀入服务器市场——英伟达首次推出独立CPU,88核Olympus核心,比x86快1.8倍,OpenAI/Anthropic/SpaceX首批采用,正式向Intel和AMD宣战。
第三,RTX Spark杀入PC市场——英伟达+联发科+台积电三方联合,基于Arm架构的AI PC超级芯片,2026年秋季面市,搭配Microsoft的Agent OS,开启”40年来PC的第一次重新发明”。
这三条产品线,覆盖了云、端、网三个层级,共同指向了一个新时代的到来:Agentic AI不再是一个概念,而是实实在在的、可量产的、可计费的AI基础设施。
而英伟达,正在成为这个新时代的”卖水人”。
站在2026年6月这个时间点回看,这场GTC台北演讲的分量可能要到一两年后才能完全显现。但有一件事是确定的:黄仁勋和英伟达,正在用Vera Rubin、Vera CPU、RTX Spark三件武器,把AI Agent时代的所有基础设施,全部押在自己身上。
对于开发者、企业和普通用户来说,这场演讲最重要的信号是:AI Agent的时代真的来了,而你需要的硬件,可能正在被重新定义。
你的下一台电脑,会选Intel、AMD,还是NVIDIA?



我要评论