黄仁勋发布「智能体电脑」RTX Spark：40年来PC最大变革，数据不出机Token全免费

本周(2026 年 6 月初),英伟达创始人黄仁勋在台北电脑展(COMPUTEX 2026)展前发布会上,亲手揭开了 RTX Spark 超级芯片的封装盒——这是他口中「40 年来个人电脑的首次彻底重新设计」。

更准确地说,RTX Spark 不是传统意义上的 CPU 也不是 GPU,而是专为 AI Agent(智能体)定制的系统级芯片。黄仁勋把它定义为「智能体电脑」(Agent Computer),并提出一个标志性口号:「数据不出机,Token 全免费」。

这八个字把当前大模型落地的两大痛点直接摁住——隐私(数据不上云)和成本(Token 不计费)。本文就围绕 RTX Spark 拆开来聊:它是什么、为什么是「40 年最大变革」、对国内产业链有什么影响,以及这个赛道里已经出现的「国产对标玩家」。

一、RTX Spark 是什么:全球首款「为 AI Agent 而生」的 PC 超级芯片

先看基本身份——RTX Spark 由英伟达与联发科联合设计,采用台积电 3 纳米工艺制造,微软深度参与系统层面的协同优化。来源:新浪科技 2026-06-07 报道(转自上观新闻)。

1.1 它不是 CPU 也不是 GPU,而是「异构融合 SoC」

传统 PC 主板上,CPU 处理逻辑、GPU 处理图形、内存各自独立,数据需要在 CPU 系统内存和 GPU 显存之间反复搬运,既耗电又延迟。

RTX Spark 把所有这些都整合到单颗芯片里,核心设计理念是「异构融合」+「统一内存架构」。

1.2 三个最颠覆性的技术细节

细节一:统一内存架构,CPU+GPU 共享最高 128GB

这是 RTX Spark 最关键的创新。传统 PC 的 CPU 内存和 GPU 显存是分开的(典型配置是 16GB 内存 + 8GB 显存),运行大模型时需要把数据从内存拷贝到显存,慢且卡。

RTX Spark 让 CPU 和 GPU 共享最高 128GB 的统一内存池,彻底消除「数据搬运」瓶颈。

细节二:第二代互联技术,片内带宽 600GB/秒

英伟达自研的片内互联技术,让 CPU 和 GPU 之间的数据交换速度达到 600GB/秒。

这个速度是什么概念?打个比方:一整部 4K 高清电影大约 100GB,理论上 RTX Spark 1 秒内可以在 CPU 和 GPU 之间传 6 部这样的电影。

细节三:本地 AI 算力 1 PetaFLOP(约 500 TOPS)

PetaFLOP 是每秒 10 的 15 次方次浮点运算。RTX Spark 的本地 AI 算力达到 1 PetaFLOP,相当于 500 TOPS(TOPS 即每秒万亿次运算,1 PetaFLOP ≈ 1000 TOPS,这里 500 TOPS 是 NPU 部分独立算力)。

做个对比:

2023 年早期 AI PC:10-40 TOPS
2024-2025 年升级款:40-60 TOPS
RTX Spark:500 TOPS(NPU 单独) + 1 PetaFLOP(整体 AI 算力)

算力一下子拉高了 10 倍以上。

二、40 年来最大变革:从「操作软件」到「表达需求」

文内图

黄仁勋在演讲中说了一段被反复引用的话:「过去 40 年里,大家开启应用、点击、输入命令来完成工作。有了 RTX Spark,用户只要提出需求,剩下的交给 PC 来完成。」

这背后是 PC 设计理念的根本转向。

2.1 过去 40 年:电脑围绕「人」设计

从 1980 年代 IBM PC、1990 年代 Windows 95 图形界面,到 2007 年 MacBook Air 笔记本普及——所有这些电脑设计,核心都是「让人类更高效地操作软件」。

无论是鼠标点击、键盘快捷键,还是触控手势,人是「操作者」,软件是「被操作者」。

2.2 未来 10 年:电脑围绕「AI」设计

RTX Spark 引领的新一代 PC,设计逻辑变成「让 AI 更高效地完成任务」。人是「需求提出者」,AI 是「任务执行者」。

数字经济学者刘兴亮对这个转变的总结很到位:「人们要从『会操作』转变为『会表达』,未来个人最重要的能力可能会变成提问、判断、创造与决策。」

💡 从「电脑为人服务」变成「电脑为 AI 服务」——这是 PC 行业 40 年来的范式大翻转。

三、「数据不出机,Token 全免费」:8 个字戳中两大痛点

黄仁勋在发布会上给出的 8 字口号——「数据不出机,Token 全免费」——是 RTX Spark 的商业价值核心。

3.1 痛点一:数据上云的隐私焦虑

回想 2026 年 5 月那次「龙虾」(OpenClaw)安装潮与卸载潮,很多用户装完当天就卸载——根因之一就是数据安全。

一个能读你本地文件、能调用你命令行工具的 AI Agent,运行在云端,意味着你所有数据都要上传到第三方服务器。

RTX Spark 让 1200 亿参数的大模型直接在本地运行。据英伟达官方指标,RTX Spark 支持本地运行 1200 亿参数大语言模型,支持 100 万 token(词元)上下文。

这意味着用户无需网络连接,所有数据完全保存在自己的设备里。

3.2 痛点二:Token 账单的成本焦虑

同一次「龙虾」卸载潮的另一个根因是不可控的 token 账单——Agent 在你电脑上 24 小时跑,可能一晚上就消耗几十美元 token。

RTX Spark 的解法是:本地运行 1200 亿参数模型,「次数不限且无需付费」(原话来自新浪科技 2026-06-07 报道)。

3.3 一个用户视角的对比

维度	云端 AI Agent	RTX Spark 本地 Agent
数据	上传云端,泄露风险	完全本地,数据不出机
成本	按 token 计费,账单不可控	一次性买断,Token 自由
响应速度	取决于网络和服务器	本地推理,毫秒级响应
隐私保护	依赖服务商合规	用户自控,数据物理隔离
离线可用	必须联网	完全离线可用

💡 数据安全和成本可控,这两条过去是大模型落地的「老大难」,RTX Spark 用一颗芯片同时解决。

💡 8 个字「数据不出机,Token 全免费」是 RTX Spark 的价值锚点——它不是「性能更强」,而是「模式更安全」。

四、芯片级技术拆解:英伟达 4 项硬指标

下面拆解 RTX Spark 的核心技术参数,数据全部来自英伟达官方指标(转引自新浪科技 2026-06-07 报道)。

4.1 指标 1:本地运行 1200 亿参数大模型

1200 亿参数是什么概念?做个类比:OpenAI 的 GPT-3.5 大约是 1750 亿参数,Anthropic 的 Claude 3 Sonnet 估计在 700-1500 亿之间。

RTX Spark 能在本地运行的模型规模,已经触及 GPT-3.5 级别。这意味着用户可以在笔记本上跑「类 GPT-3.5」水平的智能体,完成对话、写作、编程、数据分析等任务。

4.2 指标 2:支持 100 万 token 上下文

上下文窗口(Token Context)决定 AI 能「记住」多少内容。100 万 token 大约相当于:

75 万英文单词
1500 页 A4 文档
整本《战争与和平》

有了 100 万 token 上下文,AI Agent 可以一次读完一整本专业书籍,或同时分析几百页财报,这种「长文阅读能力」在本地就能用。

4.3 指标 3:3A 游戏 1440p/100FPS

RTX Spark 不是「AI 专用芯片」,它在传统图形性能上也不弱——3A 游戏大作(对硬件要求最高的 3A 级别游戏,如《赛博朋克 2077》)能在 1440p 分辨率(2560×1440)下达到 100 帧/秒。

结论:RTX Spark 是一颗「既能给 AI 用,也能给游戏用」的全能芯片。

4.4 指标 4:12K 4:2:2 视频编辑

12K 分辨率(约 11520×6480)是当前消费级视频的最高规格,4:2:2 是一种专业级色彩采样(相比常见的 4:2:0 保留更多色彩细节)。

RTX Spark 能流畅编辑 12K 4:2:2 视频,意味着专业视频创作者可以把它作为工作站使用。

五、市场反应:发布日股价剧烈分化

市场对 RTX Spark 的反应是即时的,数字很有戏剧性。

发布日股价表现(2026-06-03):

公司	涨跌幅	解读
英伟达	+6.26%	旗舰产品发布,市场认可
ARM	+15.73%	异构融合架构受益方
英特尔	-4.67%	传统 CPU 路线承压
高通	-8.78%	移动芯片路线被边缘化

核心信号:资本市场用脚投票,「AI 芯片」赢了「传统 CPU/GPU」。

💡 股价是市场最真实的表态——RTX Spark 不是「发布会噱头」,而是已经改变了产业格局的硬产品。

六、为什么是 2026 年:AI PC 终于到了「消费者愿意买」的拐点

文内图

AI PC 的概念 2023 年就有人提,为什么 2026 年才被视为「AI PC 元年」?关键是消费者付费意愿。

6.1 早期 AI PC 的两大缺陷

2023-2024 年的 AI PC 普遍存在两个问题:

算力太弱:10-40 TOPS 只能跑 70 亿参数以下小模型,实用性差
AI 像插件:AI 功能像是「额外加的」,没有从硬件层面深度整合

6.2 RTX Spark 的两个突破

突破 1:算力 10 倍提升

从 40-60 TOPS 直接跳到 500 TOPS(NPU 单独),可运行 1200 亿参数大模型——这个量级的 AI 已经能干「正经事」了。

突破 2:从「插件」变成「主导」

RTX Spark 不是「PC 加个 AI 协处理器」,而是从芯片架构层面专为 AI Agent 设计。AI 不再是「附加功能」,而是「核心主导能力」。

6.3 一组数据看拐点

中国信通院数据:2026 年一季度,国内 AI PC 渗透率达 42%,同比暴涨 380%。来源:新浪科技 2026-06-07 报道(转自上观新闻)。

💡 渗透率 42% 是个关键数字——意味着 AI PC 已经不是「极客玩具」,而是进入了大众市场。

七、国产对标:后摩智能 M50 与联想 P7

英伟达 RTX Spark 不是「孤品」,国内已有对标产品。后摩智能这家中国芯片企业是其中的代表。

7.1 后摩智能 M50:存算一体架构

后摩智能的 M50 芯片采用存算一体架构(Compute-in-Memory),把计算单元和存储单元融合在一起,避免传统冯·诺依曼架构的「数据搬运」瓶颈。

M50 关键参数(来源:新浪科技 2026-06-07 报道):

算力:160 TOPS
功耗:仅 10 瓦
内存/带宽:大内存 + 高带宽
可运行:最高 1220 亿参数本地大模型

10 瓦功耗是什么概念?普通手机快充功率 65W,M50 满载功耗 10W,比一颗 LED 灯泡还省电。

7.2 联想 P7 AI 主机:搭载 M50

2026 年 5 月,联想发布搭载后摩智能 M50 芯片的 AI 主机 P7——机身仅手掌大小(具体尺寸未披露,据后摩智能公开宣传),可流畅运行 1220 亿参数模型。

联想 P7 的定位是「桌面级 AI 主机」,比传统台式机小一个数量级。

7.3 落地场景:全息交互个人智算中心

「一人公司」聊趣智能与后摩智能合作,推出支持全息交互的个人智算中心,核心能力:

梳理日程
整理会议纪要
陪练对话
全息数字形象(老人可与远在外地的家人以「全息影像」互动)

已落地场景:上海黄浦区养老院,老人们能与远在外地的家人通过全息数字形象互动。来源:新浪科技 2026-06-07 报道。

7.4 NAS 公司:想做家庭中枢入口

某 NAS(网络存储器)公司也希望成为下一代家庭中枢入口。借助 M50 上集成的大模型能力,调动存储在 NAS 中的个人数据,使其作为个人数据中心发挥更大作用。

💡 后摩智能 + 联想 + 聊趣 + NAS,组成了「国产 AI PC 完整生态」——英伟达 RTX Spark 的「国产替代方案」已经跑通。

八、RTX Spark 对我们意味着什么:开发者、用户、产业三方视角

聊完技术参数和产业格局,回到「它对你我意味着什么」。

8.1 开发者视角:本地 Agent 开发的春天

过去 AI Agent 必须跑在云端,原因是模型太大、算力太贵。RTX Spark 改变了这个前提——1200 亿参数模型直接本地跑。

这意味着:

Agent 应用可以零延迟响应(不用等云端往返)
Agent 数据完全本地(用户隐私彻底可控)
Agent 商业模式转变——从「按 Token 收费」到「一次性买断 + 离线使用」

这正是 aizxs.com 之前发过的 5 篇【AI 编程实战】系列(Claude Code、Cursor、Coze、Dify、Codex CLI)的演进方向——从「云端 AI 编程」走向「本地 AI 编程」。

8.2 普通用户视角:数据安全 + 成本可控

对非技术用户来说,RTX Spark 解决两个最实际的痛点:

数据不上云——你给 AI 看的工作文件、家庭照片、聊天记录,完全留在自己电脑里
Token 自由——不用担心「AI 跑一晚上烧了几十美元」

8.3 产业视角:PC 行业 40 年来最大变局

从 1980 年代 IBM PC 诞生,到 1990 年代 Windows 95 普及,再到 2007 年 MacBook Air 让笔记本真正便携——40 年来 PC 行业的每次变革,都重塑了整个产业链。

RTX Spark 引领的「智能体电脑」,很可能是这个产业链又一次彻底洗牌。

九、5 个常见问题 Q&A

文内图

9.1 RTX Spark 何时上市?

据英伟达发布会,RTX Spark 预计 2026 年秋季正式上市(来源:新浪科技 2026-06-07 报道)。

9.2 多少钱?

发布会未公布具体价格,需等秋季上市时官方公布。

9.3 国内能买到吗?

英伟达 RTX Spark 在中国大陆的销售需关注美国出口管制政策,可能存在限制。国产替代方案(后摩智能 M50 + 联想 P7)是更现实的选择。

9.4 必须用 Windows 吗?

RTX Spark 是「Windows PC 超级芯片」(来源:上观新闻),主要面向 Windows 生态。Mac 用户需关注苹果 M 系列芯片的对应布局(目前 M4 Ultra 已能本地跑 700 亿参数模型)。

9.5 跟苹果 M4 Ultra 比怎么样?

公开信息显示,M4 Ultra(2024 年 10 月发布)支持 192GB 统一内存,但本地 AI 算力约 38 TOPS(NPU 部分)。RTX Spark 算力(500 TOPS NPU)是 M4 Ultra 的 13 倍以上。不过两者的生态、操作系统、用户群体都不同,直接对比意义有限。

十、未来展望 + 互动话题

10.1 三个值得关注的趋势

趋势 1:本地 AI Agent 取代云端 Agent

过去两年所有 AI Agent(无论是 ChatGPT、Claude、还是各种 Coding Agent)都是云端运行。RTX Spark 让「本地 AI Agent」成为可能,而且体验上不输云端。

趋势 2:AI PC 渗透率 5 年内突破 80%

中国信通院数据 42% 是「已经买了」,如果算上「想买」和「会买」,5 年内 AI PC 渗透率突破 80% 并不夸张。

趋势 3:国产芯片的「换道超车」机会

英伟达 RTX Spark 用「异构融合」+「统一内存」走出一条新路。后摩智能 M50 用「存算一体」走了另一条路。两条路都是对传统「CPU+GPU 分立」架构的颠覆——这给国产芯片提供了「换道超车」的机会,不需要在传统 x86 / ARM 架构上硬刚。

10.2 互动话题

黄仁勋说「过去 40 年人操作软件,未来人表达需求」。如果真到了那一天,你最想让你电脑上的 AI 帮你做什么?是自动处理邮件?整理照片?还是帮你写代码?

你最担心「本地 AI Agent」普及后,会出现什么样的新问题? 隐私?安全?失业?伦理?

欢迎在评论区聊聊你的看法,后续选题会优先考虑读者反馈。

参考资料:

新浪科技 2026-06-07《黄仁勋发布”智能体电脑”背后的商机:数据不出机,Token 全免费》https://finance.sina.cn/2026-06-07/detail-iniapwht7899463.d.html
原始来源:上观新闻(文汇报沈湫莎)
COMPUTEX 2026 官方信息:https://www.computextaipei.com.tw
英伟达 RTX Spark 官方页:https://www.nvidia.com/rtx-spark
联发科合作信息:https://www.mediatek.com
微软 Copilot+ PC 生态:https://www.microsoft.com/copilot-plus-pcs
后摩智能 M50 官方页:https://www.houmoai.com
联想 P7 AI 主机:联想集团官方公告
中国信通院 AI PC 渗透率数据:中国信通院 2026 Q1 报告