大模型”失忆症”有解了:前华为诺亚方舟主任创业,半年吸金超1亿,10篇论文助攻ICML
大模型越来越聪明,但有一个致命缺陷始终无解——记不住。
无论是ChatGPT还是Claude,每次对话都是”从零开始”。上一轮告诉它的需求,下一轮再说,它完全不记得。这种”失忆症”,正在成为AI迈向AGI的最大短板。
现在,一家来自深圳的初创企业给出了一个可能的答案。
据投资界、太平洋电脑网、新浪财经等多家媒体于2026年5月20日至22日报道,专注于”大模型记忆系统”的深圳忆纪元科技有限公司(MemoraX AI)宣布完成数千万人民币种子+轮融资。这是公司继今年4月完成种子轮融资后,在短短一个多月内完成的又一轮融资,两轮累计金额已突破1亿元人民币。
本轮由中金资本、达泰资本、华业天成联合领投,光源资本担任独家财务顾问。投资方阵容之豪华,足见资本市场对这一赛道的看好。
一、创始人背景:前华为诺亚方舟实验室主任创业
MemoraX AI的创始人,是前华为诺亚方舟实验室主任郝建邺。
诺亚方舟实验室是华为面向人工智能前沿技术的核心研究机构,汇聚了全球顶尖的AI人才。郝建邺作为实验室负责人,在大模型、强化学习、边缘计算等领域有深厚的积累。
2026年3月,郝建邺创立MemoraX AI,将创业方向锁定在了一个此前少有人问津的细分赛道——大模型记忆系统。

据郝建邺介绍,当前大模型的”智力”水平在快速提升,但”记忆力”却成为最大短板。每次对话都是独立上下文,AI无法像人类一样积累经验、形成长期记忆。这不仅影响用户体验,更成为AI Agent、个性化助手等场景落地的核心障碍。
达泰资本管理合伙人方元表示:”人工智能大模型的’智力’水平一直在快速提升,但’记忆力’水平堪忧,已然成为向AGI演进的突出短板之一。我们高度看好MemoraX AI致力于将记忆能力内化到模型的技术路径。”
二、核心技术:Agentic RL攻克”失忆症”
MemoraX AI的核心技术方向,叫做Agentic RL(智能体强化学习)。
与传统大模型依赖外部检索获取信息不同(这正是当前流行的RAG方案),MemoraX AI尝试将记忆能力真正内化进模型,实现更深层次的”内生记忆”。
打个形象的比喻:RAG方案就像是给一个失忆症患者提供一本备忘录,每次需要时翻阅查找;而内生记忆则是让患者的大脑本身恢复记忆功能,不需要外部辅助。
这背后的技术路径,是让大模型在强化学习的后训练过程中,学会”记住什么、怎么记、怎么提取”。这是一条极难走的路,但也是真正解决”失忆症”的唯一路径。
三、技术成果:82.65分SOTA,10篇论文入选ICML
技术路线是否可行,数据会说话。
MemoraX AI的核心记忆系统,在南京大学与上海AI Lab联合发布的LoCoMo-Refined严苛评测基准上取得了82.65分SOTA——即当前全球最高分,比第二名记忆框架提升30%。
这个评测基准是业内公认的高难度测试,能够在上面拿到SOTA,说明MemoraX AI的技术已经站在了全球前沿。
此外,MemoraX AI还联合牛津大学,做了两件影响深远的事:
第一,联合牛津大学构建并开源了基于真实剧本的Agent Memory评测基准ScriptMem。 在这个评测中,MemoraX取得60.3%的正确率,比第二名提升40%。这标志着大模型记忆在真实生活类场景应用上迈出了重要一步。
第二,联合牛津大学构建并开源了Coding领域的Agent Memory评测基准SWE-context-bench。 在这个评测中,MemoraX取得45%的任务解决率,比第二名提升50%。这意味着在编程生产力工具类应用上,大模型记忆技术取得了里程碑式突破。
更让人印象深刻的是学术成果输出——围绕大模型强化学习后训练、Test-Time Scaling等核心技术方向,MemoraX AI联合国内多家知名高校协同创新,共有10篇论文入选国际机器学习顶会ICML 2026。这个数字对于一家创立仅两个月的公司来说,堪称惊人。
与此同时,MemoraX AI创始团队还凭借在智能决策基础理论上的突破,获得了中国电子学会自然科学一等奖。

四、商业化方向:B端+C端双轮驱动
技术落地需要场景。MemoraX AI的商业化方向,分为B端和C端两条腿走路。
B端方向:赋能企业知识管理与专业领域知识库的智能化升级。具体场景包括:工作助手、知识管理、代码开发、智能客服、大模型安全等。这些场景都有一个共同特点——需要AI具备长期记忆能力,能够在不同时间、不同会话中保持上下文一致。
C端方向:打造面向个人用户的个性化智能助手。与B端企业客户相比,C端用户更需要”懂我”的AI——记得我的偏好、记得我的工作习惯、记得我关心的事项。MemoraX AI计划在未来12个月内推出首款C端消费级记忆智能终端产品。
据公司披露,该产品将具备主动记录、语义化存储、情景化回忆及情感演化等独特功能,真正实现”让AI成为用户的第二大脑”。
此外,公司已启动与多家三甲医院认知中心、在线教育平台及企业知识管理系统的试点合作,探索记忆智能在轻度认知障碍早期干预、个性化学习路径规划以及企业隐性知识传承等场景中的应用价值。
五、行业意义:从”外挂记忆”到”内生记忆”
MemoraX AI的出现,对整个AI行业具有标志性意义。
当前,业内解决大模型”失忆”的主流方案是RAG(检索增强生成)——通过外挂向量数据库,让大模型在回答问题前先检索相关信息。这种方案简单有效,但存在明显局限:每次对话仍需重新检索、无法真正理解上下文关联、检索质量受限于向量化的准确性。
MemoraX AI选择的”内生记忆”路径,则是从根本上让大模型自己学会记忆。这条路技术难度更高,但天花板也更高——一旦成功,AI将真正具备类似人类的连续学习和经验积累能力。
达泰资本在投资决策时特别强调,MemoraX AI在记忆建模层面的原创性与工程化落地能力是其最核心的竞争力。这两个能力缺一不可——只有原创性,技术才能持续领先;只有工程化落地,学术成果才能转化为产品。
六、竞争格局:大模型记忆赛道升温
MemoraX AI并非唯一看到这个机会的玩家。
2026年以来,随着大模型竞争进入”商业化下半场”,”记忆能力”成为各方关注的焦点。无论是OpenAI、Anthropic这样的海外巨头,还是国内的百度、阿里、字节,都在探索让大模型”记得更多、记得更久”的技术方案。
但MemoraX AI的特殊之处在于,它的切入点更底层——不是做应用层,而是深入到模型训练的后训练阶段,把记忆能力做进模型的”骨子里”。
这种技术路线,与当前大多数AI公司的”应用创新”路线形成了鲜明对比。可以说,MemoraX AI正在做一个”基础设施”级别的事情——如果成功,它的技术方案可能成为未来所有大模型的”标配”。
互动话题
大模型”失忆症”真的是AGI的绊脚石吗?你认为”内生记忆”和”外挂检索”哪种技术路线更有前景?欢迎在评论区聊聊你的看法。

七、技术原理解析:为什么大模型记不住
要理解MemoraX AI做的事情,先要理解为什么大模型会”失忆”。
当前的大语言模型,基于Transformer架构,训练时使用的是”next token prediction”范式——给定一段文本,预测下一个词应该是什么。这种范式让模型学会了”生成”,但没有让模型学会”存储”。
当模型训练完成后,它的参数就固定了。所有在训练过程中没有见过的信息,模型都无法知道;而即使是在训练中见过的信息,随着新训练的进行,也会产生”灾难性遗忘”——新学会的知识覆盖旧知识。
这就是为什么ChatGPT每次对话都是”从零开始”。不是因为它不想记住,而是它的架构本身就不支持记忆功能。
RAG方案通过外挂向量数据库解决了”信息获取”的问题,但无法解决”理解与整合”的问题。模型仍然是在做检索,而不是真正”记住所学”。
MemoraX AI的Agentic RL路径,则是从根本上改变这一点——让模型在强化学习过程中,学会区分什么值得记忆、什么可以遗忘、如何高效地存储和提取记忆信息。这条路线的核心难点在于:记忆存储和提取,不能干扰模型原本的生成能力。
这是一个极其精细的平衡,也是为什么全球范围内真正做这件事的团队屈指可数。
八、未来展望:12个月内的产品计划
技术最终要落地成产品。
MemoraX AI披露的规划显示,公司计划在未来12个月内推出首款面向C端用户的消费级记忆智能终端产品。该产品将具备四大核心功能:
主动记录:AI能够主动捕捉用户的关键信息,无需手动输入。
语义化存储:不是简单的文本存储,而是理解信息含义后进行结构化存储。
情景化回忆:能够根据用户当前场景,主动调用相关记忆。
情感演化:记忆会随着时间推移”进化”,与用户的关系越来越”懂你”。
与此同时,B端的标准化产品也在加速落地。公司正在与多家三甲医院认知中心、在线教育平台及企业知识管理系统推进试点合作,探索在医疗、教育、企业知识管理等领域应用。
如果这些产品能够按计划落地,MemoraX AI有望成为”AI时代记忆基础设施”的核心供应商。这个市场空间有多大?仅企业知识管理市场,2026年全球规模就已超过400亿美元。
而一旦个人消费级产品成熟,这个数字将成倍放大。
九、投资逻辑:为什么资本看好这个赛道
中金资本、达泰资本、华业天成三家头部机构联合领投,背后的投资逻辑值得分析。
第一,市场空间足够大。 大模型”失忆”不是某个具体产品的缺陷,而是整个行业的基础性问题。这意味着MemoraX AI做的不是一个小众市场,而是几乎所有大模型客户都需要的基础能力。
第二,技术壁垒足够高。 Agentic RL涉及强化学习、后训练、记忆建模等多个前沿领域的交叉,技术门槛极高。 MemoraX AI在LoCoMo-Refined上取得的82.65分SOTA,以及10篇ICML论文,都是技术实力的直接证明。
第三,差异化足够明显。 与其让大模型公司自己做记忆能力,不如做一个独立的”记忆层”。MemoraX AI的定位,是成为大模型记忆能力的”基础设施”,这个定位在当前的AI生态中几乎是空白。
达泰资本管理合伙人方元进一步表示:”MemoraX AI所定义的记忆智能,有望成为下一代通用人工智能的底层能力之一。这个判断,基于团队在记忆建模层面的原创性与工程化落地能力,也是我们见过的大模型记忆领域最踏实的团队。”
十、AGI路上,记忆为何如此重要
回到一个更本质的问题:为什么记忆对AGI如此重要?
人类智能的两个核心能力是”推理”和”记忆”。两者相互依存——没有记忆,推理就是无源之水;没有推理,记忆就是死数据。
当前的大模型,已经在”推理”端取得了突破性进展(GPT-5.5、Claude Opus都在推理能力上不断提升),但在”记忆”端,始终没有本质突破。
这意味着,当前的AI其实是”有智慧、无记忆”的智能体——每次对话都很聪明,但第二天就忘了你是谁;能够解决复杂问题,但无法积累经验成长。
MemoraX AI正在做的事情,就是补上这块短板。如果成功,AI将从”每次聪明的智能体”进化成”持续成长的智能体”。这或许是迈向AGI最关键的一步。



我要评论