本周(2026 年 6 月初),英伟达创始人黄仁勋在台北电脑展(COMPUTEX 2026)展前发布会上,亲手揭开了 RTX Spark 超级芯片的封装盒——这是他口中「40 年来个人电脑的首次彻底重新设计」。
更准确地说,RTX Spark 不是传统意义上的 CPU 也不是 GPU,而是专为 AI Agent(智能体)定制的系统级芯片。黄仁勋把它定义为「智能体电脑」(Agent Computer),并提出一个标志性口号:「数据不出机,Token 全免费」。
这八个字把当前大模型落地的两大痛点直接摁住——隐私(数据不上云)和成本(Token 不计费)。本文就围绕 RTX Spark 拆开来聊:它是什么、为什么是「40 年最大变革」、对国内产业链有什么影响,以及这个赛道里已经出现的「国产对标玩家」。
一、RTX Spark 是什么:全球首款「为 AI Agent 而生」的 PC 超级芯片
先看基本身份——RTX Spark 由英伟达与联发科联合设计,采用台积电 3 纳米工艺制造,微软深度参与系统层面的协同优化。来源:新浪科技 2026-06-07 报道(转自上观新闻)。
1.1 它不是 CPU 也不是 GPU,而是「异构融合 SoC」
传统 PC 主板上,CPU 处理逻辑、GPU 处理图形、内存各自独立,数据需要在 CPU 系统内存和 GPU 显存之间反复搬运,既耗电又延迟。
RTX Spark 把所有这些都整合到单颗芯片里,核心设计理念是「异构融合」+「统一内存架构」。
1.2 三个最颠覆性的技术细节
细节一:统一内存架构,CPU+GPU 共享最高 128GB
这是 RTX Spark 最关键的创新。传统 PC 的 CPU 内存和 GPU 显存是分开的(典型配置是 16GB 内存 + 8GB 显存),运行大模型时需要把数据从内存拷贝到显存,慢且卡。
RTX Spark 让 CPU 和 GPU 共享最高 128GB 的统一内存池,彻底消除「数据搬运」瓶颈。
细节二:第二代互联技术,片内带宽 600GB/秒
英伟达自研的片内互联技术,让 CPU 和 GPU 之间的数据交换速度达到 600GB/秒。
这个速度是什么概念?打个比方:一整部 4K 高清电影大约 100GB,理论上 RTX Spark 1 秒内可以在 CPU 和 GPU 之间传 6 部这样的电影。
细节三:本地 AI 算力 1 PetaFLOP(约 500 TOPS)
PetaFLOP 是每秒 10 的 15 次方次浮点运算。RTX Spark 的本地 AI 算力达到 1 PetaFLOP,相当于 500 TOPS(TOPS 即每秒万亿次运算,1 PetaFLOP ≈ 1000 TOPS,这里 500 TOPS 是 NPU 部分独立算力)。
做个对比:
- 2023 年早期 AI PC:10-40 TOPS
- 2024-2025 年升级款:40-60 TOPS
- RTX Spark:500 TOPS(NPU 单独) + 1 PetaFLOP(整体 AI 算力)
算力一下子拉高了 10 倍以上。
二、40 年来最大变革:从「操作软件」到「表达需求」

黄仁勋在演讲中说了一段被反复引用的话:「过去 40 年里,大家开启应用、点击、输入命令来完成工作。有了 RTX Spark,用户只要提出需求,剩下的交给 PC 来完成。」
这背后是 PC 设计理念的根本转向。
2.1 过去 40 年:电脑围绕「人」设计
从 1980 年代 IBM PC、1990 年代 Windows 95 图形界面,到 2007 年 MacBook Air 笔记本普及——所有这些电脑设计,核心都是「让人类更高效地操作软件」。
无论是鼠标点击、键盘快捷键,还是触控手势,人是「操作者」,软件是「被操作者」。
2.2 未来 10 年:电脑围绕「AI」设计
RTX Spark 引领的新一代 PC,设计逻辑变成「让 AI 更高效地完成任务」。人是「需求提出者」,AI 是「任务执行者」。
数字经济学者刘兴亮对这个转变的总结很到位:「人们要从『会操作』转变为『会表达』,未来个人最重要的能力可能会变成提问、判断、创造与决策。」
💡 从「电脑为人服务」变成「电脑为 AI 服务」——这是 PC 行业 40 年来的范式大翻转。
三、「数据不出机,Token 全免费」:8 个字戳中两大痛点
黄仁勋在发布会上给出的 8 字口号——「数据不出机,Token 全免费」——是 RTX Spark 的商业价值核心。
3.1 痛点一:数据上云的隐私焦虑
回想 2026 年 5 月那次「龙虾」(OpenClaw)安装潮与卸载潮,很多用户装完当天就卸载——根因之一就是数据安全。
一个能读你本地文件、能调用你命令行工具的 AI Agent,运行在云端,意味着你所有数据都要上传到第三方服务器。
RTX Spark 让 1200 亿参数的大模型直接在本地运行。据英伟达官方指标,RTX Spark 支持本地运行 1200 亿参数大语言模型,支持 100 万 token(词元)上下文。
这意味着用户无需网络连接,所有数据完全保存在自己的设备里。
3.2 痛点二:Token 账单的成本焦虑
同一次「龙虾」卸载潮的另一个根因是不可控的 token 账单——Agent 在你电脑上 24 小时跑,可能一晚上就消耗几十美元 token。
RTX Spark 的解法是:本地运行 1200 亿参数模型,「次数不限且无需付费」(原话来自新浪科技 2026-06-07 报道)。
3.3 一个用户视角的对比
| 维度 | 云端 AI Agent | RTX Spark 本地 Agent |
|---|---|---|
| 数据 | 上传云端,泄露风险 | 完全本地,数据不出机 |
| 成本 | 按 token 计费,账单不可控 | 一次性买断,Token 自由 |
| 响应速度 | 取决于网络和服务器 | 本地推理,毫秒级响应 |
| 隐私保护 | 依赖服务商合规 | 用户自控,数据物理隔离 |
| 离线可用 | 必须联网 | 完全离线可用 |
💡 数据安全和成本可控,这两条过去是大模型落地的「老大难」,RTX Spark 用一颗芯片同时解决。
💡 8 个字「数据不出机,Token 全免费」是 RTX Spark 的价值锚点——它不是「性能更强」,而是「模式更安全」。
四、芯片级技术拆解:英伟达 4 项硬指标
下面拆解 RTX Spark 的核心技术参数,数据全部来自英伟达官方指标(转引自新浪科技 2026-06-07 报道)。
4.1 指标 1:本地运行 1200 亿参数大模型
1200 亿参数是什么概念?做个类比:OpenAI 的 GPT-3.5 大约是 1750 亿参数,Anthropic 的 Claude 3 Sonnet 估计在 700-1500 亿之间。
RTX Spark 能在本地运行的模型规模,已经触及 GPT-3.5 级别。这意味着用户可以在笔记本上跑「类 GPT-3.5」水平的智能体,完成对话、写作、编程、数据分析等任务。
4.2 指标 2:支持 100 万 token 上下文
上下文窗口(Token Context)决定 AI 能「记住」多少内容。100 万 token 大约相当于:
- 75 万英文单词
- 1500 页 A4 文档
- 整本《战争与和平》
有了 100 万 token 上下文,AI Agent 可以一次读完一整本专业书籍,或同时分析几百页财报,这种「长文阅读能力」在本地就能用。
4.3 指标 3:3A 游戏 1440p/100FPS
RTX Spark 不是「AI 专用芯片」,它在传统图形性能上也不弱——3A 游戏大作(对硬件要求最高的 3A 级别游戏,如《赛博朋克 2077》)能在 1440p 分辨率(2560×1440)下达到 100 帧/秒。
结论:RTX Spark 是一颗「既能给 AI 用,也能给游戏用」的全能芯片。
4.4 指标 4:12K 4:2:2 视频编辑
12K 分辨率(约 11520×6480)是当前消费级视频的最高规格,4:2:2 是一种专业级色彩采样(相比常见的 4:2:0 保留更多色彩细节)。
RTX Spark 能流畅编辑 12K 4:2:2 视频,意味着专业视频创作者可以把它作为工作站使用。
五、市场反应:发布日股价剧烈分化
市场对 RTX Spark 的反应是即时的,数字很有戏剧性。
发布日股价表现(2026-06-03):
| 公司 | 涨跌幅 | 解读 |
|---|---|---|
| 英伟达 | +6.26% | 旗舰产品发布,市场认可 |
| ARM | +15.73% | 异构融合架构受益方 |
| 英特尔 | -4.67% | 传统 CPU 路线承压 |
| 高通 | -8.78% | 移动芯片路线被边缘化 |
核心信号:资本市场用脚投票,「AI 芯片」赢了「传统 CPU/GPU」。
💡 股价是市场最真实的表态——RTX Spark 不是「发布会噱头」,而是已经改变了产业格局的硬产品。
六、为什么是 2026 年:AI PC 终于到了「消费者愿意买」的拐点

AI PC 的概念 2023 年就有人提,为什么 2026 年才被视为「AI PC 元年」?关键是消费者付费意愿。
6.1 早期 AI PC 的两大缺陷
2023-2024 年的 AI PC 普遍存在两个问题:
- 算力太弱:10-40 TOPS 只能跑 70 亿参数以下小模型,实用性差
- AI 像插件:AI 功能像是「额外加的」,没有从硬件层面深度整合
6.2 RTX Spark 的两个突破
突破 1:算力 10 倍提升
从 40-60 TOPS 直接跳到 500 TOPS(NPU 单独),可运行 1200 亿参数大模型——这个量级的 AI 已经能干「正经事」了。
突破 2:从「插件」变成「主导」
RTX Spark 不是「PC 加个 AI 协处理器」,而是从芯片架构层面专为 AI Agent 设计。AI 不再是「附加功能」,而是「核心主导能力」。
6.3 一组数据看拐点
中国信通院数据:2026 年一季度,国内 AI PC 渗透率达 42%,同比暴涨 380%。来源:新浪科技 2026-06-07 报道(转自上观新闻)。
💡 渗透率 42% 是个关键数字——意味着 AI PC 已经不是「极客玩具」,而是进入了大众市场。
七、国产对标:后摩智能 M50 与联想 P7
英伟达 RTX Spark 不是「孤品」,国内已有对标产品。后摩智能这家中国芯片企业是其中的代表。
7.1 后摩智能 M50:存算一体架构
后摩智能的 M50 芯片采用存算一体架构(Compute-in-Memory),把计算单元和存储单元融合在一起,避免传统冯·诺依曼架构的「数据搬运」瓶颈。
M50 关键参数(来源:新浪科技 2026-06-07 报道):
- 算力:160 TOPS
- 功耗:仅 10 瓦
- 内存/带宽:大内存 + 高带宽
- 可运行:最高 1220 亿参数本地大模型
10 瓦功耗是什么概念?普通手机快充功率 65W,M50 满载功耗 10W,比一颗 LED 灯泡还省电。
7.2 联想 P7 AI 主机:搭载 M50
2026 年 5 月,联想发布搭载后摩智能 M50 芯片的 AI 主机 P7——机身仅手掌大小(具体尺寸未披露,据后摩智能公开宣传),可流畅运行 1220 亿参数模型。
联想 P7 的定位是「桌面级 AI 主机」,比传统台式机小一个数量级。
7.3 落地场景:全息交互个人智算中心
「一人公司」聊趣智能与后摩智能合作,推出支持全息交互的个人智算中心,核心能力:
- 梳理日程
- 整理会议纪要
- 陪练对话
- 全息数字形象(老人可与远在外地的家人以「全息影像」互动)
已落地场景:上海黄浦区养老院,老人们能与远在外地的家人通过全息数字形象互动。来源:新浪科技 2026-06-07 报道。
7.4 NAS 公司:想做家庭中枢入口
某 NAS(网络存储器)公司也希望成为下一代家庭中枢入口。借助 M50 上集成的大模型能力,调动存储在 NAS 中的个人数据,使其作为个人数据中心发挥更大作用。
💡 后摩智能 + 联想 + 聊趣 + NAS,组成了「国产 AI PC 完整生态」——英伟达 RTX Spark 的「国产替代方案」已经跑通。
八、RTX Spark 对我们意味着什么:开发者、用户、产业三方视角
聊完技术参数和产业格局,回到「它对你我意味着什么」。
8.1 开发者视角:本地 Agent 开发的春天
过去 AI Agent 必须跑在云端,原因是模型太大、算力太贵。RTX Spark 改变了这个前提——1200 亿参数模型直接本地跑。
这意味着:
- Agent 应用可以零延迟响应(不用等云端往返)
- Agent 数据完全本地(用户隐私彻底可控)
- Agent 商业模式转变——从「按 Token 收费」到「一次性买断 + 离线使用」
这正是 aizxs.com 之前发过的 5 篇【AI 编程实战】系列(Claude Code、Cursor、Coze、Dify、Codex CLI)的演进方向——从「云端 AI 编程」走向「本地 AI 编程」。
8.2 普通用户视角:数据安全 + 成本可控
对非技术用户来说,RTX Spark 解决两个最实际的痛点:
- 数据不上云——你给 AI 看的工作文件、家庭照片、聊天记录,完全留在自己电脑里
- Token 自由——不用担心「AI 跑一晚上烧了几十美元」
8.3 产业视角:PC 行业 40 年来最大变局
从 1980 年代 IBM PC 诞生,到 1990 年代 Windows 95 普及,再到 2007 年 MacBook Air 让笔记本真正便携——40 年来 PC 行业的每次变革,都重塑了整个产业链。
RTX Spark 引领的「智能体电脑」,很可能是这个产业链又一次彻底洗牌。
九、5 个常见问题 Q&A

9.1 RTX Spark 何时上市?
据英伟达发布会,RTX Spark 预计 2026 年秋季正式上市(来源:新浪科技 2026-06-07 报道)。
9.2 多少钱?
发布会未公布具体价格,需等秋季上市时官方公布。
9.3 国内能买到吗?
英伟达 RTX Spark 在中国大陆的销售需关注美国出口管制政策,可能存在限制。国产替代方案(后摩智能 M50 + 联想 P7)是更现实的选择。
9.4 必须用 Windows 吗?
RTX Spark 是「Windows PC 超级芯片」(来源:上观新闻),主要面向 Windows 生态。Mac 用户需关注苹果 M 系列芯片的对应布局(目前 M4 Ultra 已能本地跑 700 亿参数模型)。
9.5 跟苹果 M4 Ultra 比怎么样?
公开信息显示,M4 Ultra(2024 年 10 月发布)支持 192GB 统一内存,但本地 AI 算力约 38 TOPS(NPU 部分)。RTX Spark 算力(500 TOPS NPU)是 M4 Ultra 的 13 倍以上。不过两者的生态、操作系统、用户群体都不同,直接对比意义有限。
十、未来展望 + 互动话题
10.1 三个值得关注的趋势
趋势 1:本地 AI Agent 取代云端 Agent
过去两年所有 AI Agent(无论是 ChatGPT、Claude、还是各种 Coding Agent)都是云端运行。RTX Spark 让「本地 AI Agent」成为可能,而且体验上不输云端。
趋势 2:AI PC 渗透率 5 年内突破 80%
中国信通院数据 42% 是「已经买了」,如果算上「想买」和「会买」,5 年内 AI PC 渗透率突破 80% 并不夸张。
趋势 3:国产芯片的「换道超车」机会
英伟达 RTX Spark 用「异构融合」+「统一内存」走出一条新路。后摩智能 M50 用「存算一体」走了另一条路。两条路都是对传统「CPU+GPU 分立」架构的颠覆——这给国产芯片提供了「换道超车」的机会,不需要在传统 x86 / ARM 架构上硬刚。
10.2 互动话题
黄仁勋说「过去 40 年人操作软件,未来人表达需求」。如果真到了那一天,你最想让你电脑上的 AI 帮你做什么?是自动处理邮件?整理照片?还是帮你写代码?
你最担心「本地 AI Agent」普及后,会出现什么样的新问题? 隐私?安全?失业?伦理?
欢迎在评论区聊聊你的看法,后续选题会优先考虑读者反馈。
参考资料:
- 新浪科技 2026-06-07《黄仁勋发布”智能体电脑”背后的商机:数据不出机,Token 全免费》https://finance.sina.cn/2026-06-07/detail-iniapwht7899463.d.html
- 原始来源:上观新闻(文汇报 沈湫莎)
- COMPUTEX 2026 官方信息:https://www.computextaipei.com.tw
- 英伟达 RTX Spark 官方页:https://www.nvidia.com/rtx-spark
- 联发科合作信息:https://www.mediatek.com
- 微软 Copilot+ PC 生态:https://www.microsoft.com/copilot-plus-pcs
- 后摩智能 M50 官方页:https://www.houmoai.com
- 联想 P7 AI 主机:联想集团官方公告
- 中国信通院 AI PC 渗透率数据:中国信通院 2026 Q1 报告



我要评论