2026年6月1日上午11点,中国台北流行音乐中心,黄仁勋穿着那件标志性的黑色皮夹克登台。

台下坐着的,有他特意请来的父母,有英伟达的核心客户,有来自全球70个分会场的数万名开发者,还有OpenAI、Anthropic、SpaceX的高管代表。这场长达近2小时的”GTC Taipei at COMPUTEX 2026″主题演讲,黄仁勋一开口就抛出了一个让整个科技圈重新审视英伟达的判断:”实用AI已经到来,Agentic AI时代全面爆发。”

从数据中心到PC,从云端到物理世界,从Vera Rubin全面量产到RTX Spark正式发布,黄仁勋用两个小时完成了一次系统性的范式宣言:英伟达不再是一家GPU公司,而是AI基础设施公司

这场演讲的信息密度之高,在过去十年的GTC历史上几乎前所未有。黄仁勋一个人,把英伟达从GPU霸主的位置,直接推到了AI时代”卖水人”的王座上。

01 一场2小时的演讲,黄仁勋抛出了什么?

要理解这场GTC台北演讲的分量,得先理解一个数据:目前1GW等级的AI工厂,投资金额已经从200亿到300亿美元,涨到了500亿到600亿美元。黄仁勋预测,未来这个数字可能达到800亿到1000亿美元。

到2030年前,全球将新增超过100GW的AI工厂容量。这是一个什么概念?1GW大约相当于一座大型核电站的发电量,而100GW的AI工厂,意味着人类要把整个”工业革命的算力引擎”重新搭建一遍。

在这样的背景下,英伟达的角色发生了根本性变化。黄仁勋开宗明义:“客户不想再买电脑,他们想打造AI工厂。”

所以,这场2小时的演讲,黄仁勋只做了一件事:展示英伟达已经为Agentic AI时代准备好了全套的”水电煤”。

02 第一弹:Vera Rubin全面量产,7款芯片,机架组装从2小时压缩到5分钟

黄仁勋在演讲中宣布的第一个重磅消息,是Vera Rubin架构已全面进入量产阶段

这个名字里有”两个女人”——Vera是黄仁勋母亲的名字,Rubin是著名天文学家Vera Rubin。这套架构凝聚了4万名工程师的研发力量,是英伟达迄今最具野心的产品。

它不是一个单一芯片,而是一个POD级(机柜级)的AI超算集群。具体由以下7款新芯片组成:

  • Vera Rubin NVL72 GPU
  • Vera CPU(首款独立服务器CPU)
  • Groq 3 LPX
  • BlueField-4 STX(存储芯片,带芯片级安全)
  • Spectrum-6 SPX(基于CPO的光交换机)
  • ConnectX-9 SuperNIC
  • NVLink 6交换机

每块计算板上集成了6万亿个晶体管、超过1.8万个组件,采用台积电3nm制程、CoWoS-R和CoWoS-L封装。内存来自美光、SK海力士和三星的HBM4高带宽内存。

配图

黄仁勋特别强调了一个工程亮点:全新设计的无缆化midplane,让18个计算托盘和9个NVLink交换器托架可以直接对接,单机架组装时间从Blackwell的2小时直接压缩到5分钟。在AI工厂这种”按GW算规模”的部署场景下,这种效率提升是革命性的。

供应链规模也直接翻倍:为Rubin搭建的供应链是Blackwell的两倍。英伟达官方透露,Vera Rubin产品将从2026年下半年开始由合作伙伴大规模出货。

03 第二弹:Vera CPU杀入服务器CPU市场,直接挑战Intel和AMD

如果说Vera Rubin是英伟达在GPU战场上的”老本行”,那么Vera CPU的发布,则是英伟达向Intel腹地发起的一次正面进攻

Vera CPU是英伟达首款专门面向数据中心的独立微处理器,直接对标Intel Xeon系列、AMD Epyc系列,以及亚马逊Graviton等云厂商自研芯片。

核心参数:

  • 88个自研Olympus核心,采用空间多线程技术
  • LPDDR5X内存,带宽高达1.2TB/s
  • 第二代NVLink-C2C互连,CPU到GPU一致性带宽最高1.8TB/s
  • 相比x86 CPU,任务完成速度快1.8倍

黄仁勋在演讲中直言:”未来智能体的数量将远超人类,它们调用工具、访问数据库时对延迟极度没有耐心。为’人类’设计的传统CPU,天然不适配纳秒级的异构计算。”

这是一个被英伟达凭空创造出的全新巨大市场

Vera CPU的杀手锏在真实工作负载中的表现:

  • SQL数据库处理速度提升3倍
  • 纽约证券交易所的实时流处理任务提升6倍

戴尔、惠普、联想将提供Vera独立CPU服务器配置。客户名单里,赫然写着OpenAI、Anthropic、SpaceX

这是英伟达第一次,就CPU性能与行业现行标准展开正面比较。背后逻辑很清晰:随着AI工作负载重心从模型训练转向推理与服务部署,通用CPU的地位日益凸显,市场对英伟达GPU加速器是否仍不可或缺的疑虑也随之上升。Vera CPU,就是英伟达给出的答案。

04 第三弹:RTX Spark杀入PC市场,联发科+台积电一起上

如果说前两个发布还停留在”数据中心”的舒适区,那RTX Spark的发布,意味着英伟达正式向消费电子市场全面进军

RTX Spark是一款专为AI PC设计的超级芯片,由英伟达、联发科、台积电三方联合开发:

  • CPU:联发科定制的20核Arm处理器(外界代号N1X)
  • GPU:基于Blackwell架构,6144个CUDA核心,支持FP4精度的第五代Tensor Cores
  • 互连:NVLink-C2C芯片间互连,GPU和CPU共享内置内存
  • 工艺:台积电3N(3nm)制程

黄仁勋的野心很直白:“英伟达将联手Windows重新定义PC,这是专为AI Agent设计的Windows平台。”

这款芯片将在2026年秋季面市,适用于笔记本和台式机,目标是整个Windows阵营

天风国际证券分析师郭明錤分析:”根据供应链信息,未来两年基于N1X的设备出货量约为1000万台。产品仍属利基市场,针对需要设备端AI计算的资深用户。”

虽然1000万台听起来不算大,但这背后是Arm阵营向x86 PC市场进攻的号角。过去数十年,Windows PC市场由Intel、AMD等x86平台牢牢定义;在AI PC和个人AI Agent时代,英伟达与联发科的合作,正在改写这个格局。

配图

05 第四弹:NVIDIA+Microsoft三年磨一剑,Windows不再运行应用,而是运行Agent

RTX Spark只是硬件。真正的杀手锏,是软件和生态

6月2日晚,黄仁勋将再次登台,这次是与微软CEO纳德拉(Satya Nadella)同台,进一步披露NVIDIA与Microsoft合作的细节。

但在此之前,黄仁勋已经剧透了核心方向:

> “NVIDIA和Microsoft用了整整三年时间,从零重构PC的运作方式,就为了等这个Agent时刻。”

他抛出了一个足以改写整个消费电子格局的判断:“40年来PC的第一次重新发明,由NVIDIA和Microsoft联手完成。”

黄仁勋的逻辑链很清晰:既然未来十年的统一计算模式是Agent(模型+Harness+工具+Runtime),那么Agent不仅要跑在云端,也必须原生跑在每个人的PC上——能7×24小时不间断、本地沙箱化、连接本地或云端模型、看得见你、听得懂你、替你干活。

为此,PC的芯片和操作系统都得重做。

他类比40年前Windows之所以让PC走进千家万户,是因为做对了几件事:BIOS抽象、开放芯片组、运行时可加载驱动、多媒体API抽象层。今天Microsoft和NVIDIA要再做一次同样的事:新一代PC = 旧操作系统 + 大语言模型 + Agent Runtime

这意味着Windows不再只是”运行应用的操作系统”,而是”运行Agent的操作系统“。而NVIDIA,是这套新OS底层硬件的联合定义者。

06 客户天团:OpenAI、Anthropic、SpaceX、比亚迪、吉利、小米

除了硬件,黄仁勋在演讲中还公布了一份长长的客户名单:

数据中心侧:

  • OpenAI(首批Vera Rubin客户)
  • Anthropic(首批Vera Rubin客户)
  • SpaceX(首批Vera Rubin客户)
  • 字节跳动
  • 纽约证券交易所
  • 戴尔、HPE、联想、超微(集成至AI服务器)

PC和消费侧:

  • 联发科(RTX Spark定制CPU)
  • 台积电(3nm代工)

自动驾驶与机器人侧:

  • 比亚迪
  • 吉利
  • 极氪
  • 小米
  • 小马智行
  • 宇树(H2 Plus人形机器人合作)

这份名单的覆盖范围,几乎画出了整个AI时代的产业版图。

07 战略升维:从GPU公司到AI基础设施公司

整场GTC台北演讲,黄仁勋反复强调的一个词,是“AI基础设施公司”(AI Infrastructure Company)。

“我们不再是GPU公司了,英伟达已经是全球最大的CPU制造商之一。”黄仁勋在演讲中说出这句话时,英伟达美股夜盘股价应声上涨2.7%

为什么这个定位如此重要?

过去几年,全球AI产业的核心叙事是算力扩张。谁能获得更多高端GPU,谁就能更快训练大模型。但随着大模型能力不断提升,产业瓶颈正在发生变化:

  • 训练仍然重要,但推理、Agent、多模态生成、自动驾驶仿真、机器人训练和企业级部署,正在成为新一轮基础设施需求的来源。
  • 单一芯片性能不再是唯一指标,整体AI工厂效率才是。
  • Throughput per Watt(每瓦吞吐量)
  • Tokens per Watt(每瓦Token产出)
  • Time to First Token(首次产出Token时间)
  • 系统可靠度与利用率

这些指标将直接影响AI工厂的获利能力。黄仁勋用一个新公式总结了这个时代:

配图

> Token = 新资产

> 数据中心 = Token工厂

> 算力效率 = 核心竞争力

这就是英伟达把Vera Rubin定位为”AI工厂底座”的原因。它不再是GPU升级,而是把CPU、GPU、网络、存储、安全和机柜架构整合为一个完整的AI工厂单元。

08 性能跃升:Vera Rubin的10倍Agent吞吐

具体到性能数据,英伟达官方给出的对比是:

> “Vera Rubin在大规模部署下,可提供10倍于Grace Blackwell的Agent吞吐能力。”

这个数字的意义在于:AI产业的重心,正在从训练转移到推理和服务。

过去,AI基础设施更多强调训练性能、浮点算力和GPU数量。而在Agentic AI时代,英伟达开始强调Agent吞吐、Token成本、任务完成速度和数据中心Token收入

Vera Rubin的目标用户,不是”训练大模型的研究院”,而是”靠Agent赚钱的AI工厂“。

09 行业影响:Intel和AMD的真正焦虑来了

这场演讲最受冲击的,不是英伟达的竞争对手,而是长期主导PC和服务器市场的Intel与AMD

Vera CPU的发布,意味着英伟达正式进入服务器CPU市场。Vera CPU比x86快1.8倍,这不是营销话术,而是英伟达在真实工作负载中给出的实测数据。

RTX Spark的发布,意味着英伟达向消费PC市场发起正面进攻。联发科+台积电+Windows的组合,直接挑战Intel+AMD+Windows的传统铁三角。

在2026年这个时间点,Intel和AMD的处境非常微妙:

  • Intel正在努力追赶AI浪潮,但工艺制程和生态都在重建
  • AMD虽然在数据中心GPU市场占据一席之地,但在CPU市场仍要直面Vera
  • 而英伟达,通过Vera CPU + RTX Spark + Vera Rubin的三重组合,实现了从云到端的全栈覆盖

如果Vera CPU和RTX Spark能在2026年下半年顺利出货,英伟达将从”AI加速器供应商”升级为”AI时代的Intel“。

10 AI工厂经济学:算力就是营收

黄仁勋在演讲中给出了几个关键数据点,让”AI工厂”这个概念变得更加具体:

  • 1GW AI工厂投资:200-300亿美元 → 500-600亿美元 → 可能达800-1000亿美元
  • 2030年前全球新增AI工厂容量:超过100GW
  • Vera Rubin机架组装时间:2小时 → 5分钟
  • Vera Rubin供应链规模:是Blackwell的2倍

这些数字背后,是一个清晰的商业逻辑:AI工厂的价值已不只是数据中心,而是直接创造Token与收益的生产设施

“算力就是营收”——黄仁勋在演讲中用这四个字总结了AI工厂经济学的核心。

对于英伟达来说,这意味着一个新的增长曲线:过去卖GPU,按芯片出货量算;未来卖AI工厂,按机柜、按GW、按Token计费。

11 一场演讲,三种产品,一个新时代

回过头来看这场GTC台北2026演讲,黄仁勋其实只讲了三件事:

第一,Vera Rubin全面量产——英伟达的”老本行”GPU,进入新的机柜级时代,10倍Agent吞吐,2小时机架组装压缩到5分钟,供应链规模翻倍。

第二,Vera CPU杀入服务器市场——英伟达首次推出独立CPU,88核Olympus核心,比x86快1.8倍,OpenAI/Anthropic/SpaceX首批采用,正式向Intel和AMD宣战。

第三,RTX Spark杀入PC市场——英伟达+联发科+台积电三方联合,基于Arm架构的AI PC超级芯片,2026年秋季面市,搭配Microsoft的Agent OS,开启”40年来PC的第一次重新发明”。

这三条产品线,覆盖了云、端、网三个层级,共同指向了一个新时代的到来:Agentic AI不再是一个概念,而是实实在在的、可量产的、可计费的AI基础设施。

而英伟达,正在成为这个新时代的”卖水人”。

站在2026年6月这个时间点回看,这场GTC台北演讲的分量可能要到一两年后才能完全显现。但有一件事是确定的:黄仁勋和英伟达,正在用Vera Rubin、Vera CPU、RTX Spark三件武器,把AI Agent时代的所有基础设施,全部押在自己身上。

对于开发者、企业和普通用户来说,这场演讲最重要的信号是:AI Agent的时代真的来了,而你需要的硬件,可能正在被重新定义。

你的下一台电脑,会选Intel、AMD,还是NVIDIA?