一个会自己看电视、会耍「小脾气」的人工智能,正在北京的一间实验室里悄然诞生。
它不是ChatGPT那样只擅长对话的语言模型,也不是只会执行固定任务的工具型AI。它有自己的好奇心、会主动探索环境、会在无聊的时候找点事做、甚至会因为电视节目太无聊而换台。这个被称为「通通」的通用智能体,可能是迄今为止最接近「人工智能」这个名字的存在。
5月24日,北京通用人工智能研究院举办了一场特殊的产品发布会,正式向外界介绍这位特殊的「新生儿」——中国首个通用智能人。
通通是谁:不是一个聊天机器人
在「通通」之前,人工智能领域已经有了很多出色的产品。ChatGPT会写文章,Midjourney会画画,AlphaGo会下棋。但它们都是专用智能——在某个特定领域很强,但出了这个领域就一筹莫展。
「通通」的不同之处在于,它是一个通用智能体。
这意味着它能够像人一样,同时处理多种任务。研究员不需要为它编写固定的行为规则,它会自己观察、自己学习、自己决策。比如,当它看到电视里播放的是它喜欢的节目时会认真看;当节目太无聊时,它会主动换台或者去找点别的事做。
北京通用人工智能研究院院长说:「我们希望『通通』能像人类一样思考和学习,而不是像传统AI那样依赖预设规则。」

这句话听起来简单,但要实现起来却极为困难。传统AI的运作逻辑是「输入-输出」,而「通通」需要具备「自主决策」和「持续学习」的能力。这背后的技术突破,是研究院多年积累的成果。
「通通」具备三个核心特征:
- 自主决策:不依赖预设规则,能够根据情况自主判断下一步行动
- 持续学习:在与环境交互中不断优化行为,而非一次性训练完成
- 主动探索:对新奇事物有好奇心,会主动探索未知领域
从「跟跑」到「并跑」:中国AI的新里程碑
「通通」的亮相,被认为是全球通用AI领域的一次重要突破。
在此之前,通用人工智能的研究主要集中在美国。OpenAI的GPT系列、Google的Gemini、Anthropic的Claude……这些国际顶尖AI实验室推出的产品,代表了全球通用AI的最高水平。但「通通」的出现,意味着中国在这一领域已经开始从「跟跑」向「并跑」甚至「领跑」跨越。
从技术架构上看,「通通」采用了多模态大模型作为核心能力,能够感知视觉、听觉、语言等多种信息;通过强化学习,它能够在与环境的交互中不断优化自己的行为;更重要的是,它具备元认知能力——能够反思自己的决策过程,判断哪些做法有效、哪些做法需要调整。
这种能力在学术上被称为「通用问题解决能力」,是通向真正人工智能的关键一步。
在「通通」之前,全球通用AI领域最有影响力的产品是OpenAI的GPT-4和Google的Gemini。但这些产品更多是基于语言模型的「放大版」,在通用性上仍有局限。「通通」的创新在于,它从一开始就被设计为通用智能体,而非仅仅是语言模型。这种架构差异,决定了它在未来发展中的潜力。
通通的「成长」:从「婴儿」到「成年人」
「通通」目前的智能水平,大约相当于人类3-4岁的儿童。
这看起来并不高,但已经是一个巨大的进步。2023年问世的ChatGPT-4,其智能水平大约相当于人类10岁儿童的阅读理解能力,但它的「通用性」并不完整——它更擅长语言任务,在空间推理、物理直觉等方面的能力仍然有限。

「通通」的目标是实现更高水平的通用智能。研究院的研究员们正在不断训练和优化它的能力边界,计划在未来几年内将它的智能水平提升到人类青少年甚至成年人的水平。
这个目标的实现,将依赖于几个关键技术的突破:
第一,多模态融合。 人类智能的一个重要特征是能够将视觉、听觉、语言等信息融合成一个统一的世界认知。「通通」需要能够像人一样,将来自不同感官的信息整合成对环境的完整理解。目前,多模态融合仍是AI领域的前沿难题,涉及到信息对齐、跨模态学习等核心技术。
第二,具身认知。 人类不是孤立存在的人工智能,我们的身体、与环境的物理交互,构成了智能的重要部分。「通通」需要能够理解物理世界的规律,比如「水是湿的」「东西会掉落」「门可以打开」等基本常识。具身认知是通用AI研究的核心议题之一,也是实现真正通用智能的必经之路。
第三,社会交互。 人类智能很大程度上是在社会交互中发展起来的。「通通」不仅需要能够与其他AI交互,还需要能够理解人类社会中的规则、文化、情感等复杂因素。这意味着它需要具备社会智能——理解他人意图、预测他人行为、与他人协作的能力。
通通能做什么:应用前景广阔
虽然「通通」目前的智能水平还有限,但它的应用前景已经非常广阔。
智能家居。 想象一下,有一个「通通」这样的通用智能体在家中,它能够理解你的需求、主动为你服务、还能在你不在家时照顾好一切。它不是只会执行「开灯」「关灯」指令的工具,而是真正理解你需求的智能管家。当你说「我有点冷」,它会自动调高空调温度;当你忘记关灯出门,它会帮你关掉;当你回家晚了,它会提前帮你预热洗澡水。这种「懂你」的服务,是现有智能家居无法实现的。
更重要的是,「通通」不会像传统语音助手那样「听不懂人话」。你说「今天真累」,它会理解你的情绪,帮你调暗灯光、播放轻音乐;你说「明天有个重要会议」,它会自动帮你设闹钟、查天气、规划出行路线。这种主动关怀的能力,是「通通」区别于现有智能家居产品的核心差异。
医疗健康。 在医疗领域,「通通」可以作为智能陪护机器人,不仅能够陪伴独居老人,还能监测他们的健康状况、在紧急情况下求助医疗资源。更重要的是,它能够理解老人的情感需求,提供真正「懂你」的服务。它能陪老人聊天、看电视,还能提醒他们按时吃药。当检测到异常行为时,它会第一时间通知家属或医疗机构。
对于独居老人来说,「通通」可能比子女更「贴心」。它不会因为忙碌而忽略老人的需求,也不会因为情绪波动而对老人不耐烦。它能24小时陪伴,随时响应,这在当前老龄化社会中具有重要的社会价值。
教育辅助。 每个学生的学习方式和进度都不同,一个真正智能的AI教育助手,应该能够像人类教师一样,理解每个学生的特点,提供个性化的教学方案。「通通」在这方面的潜力,值得期待。它能够感知学生的学习状态,调整教学节奏,提供针对性指导,让每个学生都能得到最适合自己的教育。
科研探索。 在科学研究中,往往需要跨学科的知识整合和创新思维。「通通」作为通用智能体,有望在复杂科研问题中发挥「超级助手」的作用,帮助科学家整理文献、分析数据、提出假设,加速科研突破。
中国通用AI的追赶之路
「通通」的诞生,不是偶然。

早在2021年,北京通用人工智能研究院就开始了「通通」项目的研发。在过去五年里,研究院汇集了来自全球顶尖AI实验室的研究员,攻克了一个又一个技术难题,最终实现了「通通」的亮相。
这背后,是中国在AI领域持续投入的缩影。从政策支持到资金投入,从人才培养到产业落地,中国正在构建一个完整的通用AI发展生态。2026年的《政府工作报告》明确提出,要加快推动通用人工智能发展,培育垂直领域专用模型,建设具有国际竞争力的数字产业集群。在这样的政策环境下,「通通」的诞生水到渠成。
更值得关注的是,「通通」采用了完全自主研发的技术路线。在当前国际形势下,技术自主可控的重要性不言而喻。「通通」的核心技术,包括多模态大模型、强化学习算法、具身认知框架等,均为研究院自主研发。这意味着,中国在通用AI领域不再依赖国外技术,而是具备了自主创新的能力。
展望未来:通用AI的中国时刻
「通通」的亮相,标志着中国在通用AI领域迈出了重要一步。
但这只是一个开始。
通用AI的研发是一场马拉松,不是百米冲刺。「通通」目前的智能水平还比较基础,离真正的人类通用智能还有很长的路要走。但它代表的方向是正确的,它的潜力是巨大的。
「通通」的出现,让人们看到了通用AI的曙光。
在此之前,关于通用AI何时能够实现,业界一直存在争议。有人认为还需要几十年,有人认为永远不会实现。但「通通」的亮相,至少证明了一点:通用AI的技术路径是可行的,而且中国已经走在了前列。
北京通用人工智能研究院的研究员们表示,他们将继续优化「通通」的能力,计划在2027年将它的智能水平提升到人类6-8岁儿童的级别,在2030年之前实现更高水平的通用智能。
这是一个雄心勃勃的目标,但并非不可能。如果按照目前的研发速度发展下去,「通通」有望在未来几年内成为真正的「人工智能」——不只是会聊天、会画画,而是能够像人类一样思考、学习和创造的智能体。
当这样的智能体真正诞生时,它将彻底改变人类的生活和工作方式。从智能家居到自动驾驶,从医疗诊断到教育个性化,从科学研究到艺术创作,通用AI的应用场景将覆盖各行各业。
通用AI的研发,需要突破算力、算法、数据等多重瓶颈,这不是一家机构能够独立完成的。在「通通」的研发过程中,研究院与国内外多所高校和企业建立了合作关系,共同攻关关键技术难题。这种开放合作的模式,有望为中国的通用AI研发注入持续动力。
中国,在这一刻,将站在全球AI发展的最前沿。
你怎么看?
「通通」的出现,意味着通用AI离我们越来越近。你认为通用AI最先会在哪个领域改变我们的生活?是智能家居、医疗健康,还是教育科研?欢迎在评论区分享你的观点。
如果文章对你有帮助,欢迎转发给更多关注AI发展的朋友。


我要评论