大模型"失忆症"有解了：前华为诺亚方舟主任创业，半年吸金超1亿，10篇论文助攻ICML

大模型”失忆症”有解了：前华为诺亚方舟主任创业，半年吸金超1亿，10篇论文助攻ICML

大模型越来越聪明，但有一个致命缺陷始终无解——记不住。

无论是ChatGPT还是Claude，每次对话都是”从零开始”。上一轮告诉它的需求，下一轮再说，它完全不记得。这种”失忆症”，正在成为AI迈向AGI的最大短板。

现在，一家来自深圳的初创企业给出了一个可能的答案。

据投资界、太平洋电脑网、新浪财经等多家媒体于2026年5月20日至22日报道，专注于”大模型记忆系统”的深圳忆纪元科技有限公司（MemoraX AI）宣布完成数千万人民币种子+轮融资。这是公司继今年4月完成种子轮融资后，在短短一个多月内完成的又一轮融资，两轮累计金额已突破1亿元人民币。

本轮由中金资本、达泰资本、华业天成联合领投，光源资本担任独家财务顾问。投资方阵容之豪华，足见资本市场对这一赛道的看好。

一、创始人背景：前华为诺亚方舟实验室主任创业

MemoraX AI的创始人，是前华为诺亚方舟实验室主任郝建邺。

诺亚方舟实验室是华为面向人工智能前沿技术的核心研究机构，汇聚了全球顶尖的AI人才。郝建邺作为实验室负责人，在大模型、强化学习、边缘计算等领域有深厚的积累。

2026年3月，郝建邺创立MemoraX AI，将创业方向锁定在了一个此前少有人问津的细分赛道——大模型记忆系统。

据郝建邺介绍，当前大模型的”智力”水平在快速提升，但”记忆力”却成为最大短板。每次对话都是独立上下文，AI无法像人类一样积累经验、形成长期记忆。这不仅影响用户体验，更成为AI Agent、个性化助手等场景落地的核心障碍。

达泰资本管理合伙人方元表示：”人工智能大模型的’智力’水平一直在快速提升，但’记忆力’水平堪忧，已然成为向AGI演进的突出短板之一。我们高度看好MemoraX AI致力于将记忆能力内化到模型的技术路径。”

二、核心技术：Agentic RL攻克”失忆症”

MemoraX AI的核心技术方向，叫做Agentic RL（智能体强化学习）。

与传统大模型依赖外部检索获取信息不同（这正是当前流行的RAG方案），MemoraX AI尝试将记忆能力真正内化进模型，实现更深层次的”内生记忆”。

打个形象的比喻：RAG方案就像是给一个失忆症患者提供一本备忘录，每次需要时翻阅查找；而内生记忆则是让患者的大脑本身恢复记忆功能，不需要外部辅助。

这背后的技术路径，是让大模型在强化学习的后训练过程中，学会”记住什么、怎么记、怎么提取”。这是一条极难走的路，但也是真正解决”失忆症”的唯一路径。

三、技术成果：82.65分SOTA，10篇论文入选ICML

技术路线是否可行，数据会说话。

MemoraX AI的核心记忆系统，在南京大学与上海AI Lab联合发布的LoCoMo-Refined严苛评测基准上取得了82.65分SOTA——即当前全球最高分，比第二名记忆框架提升30%。

这个评测基准是业内公认的高难度测试，能够在上面拿到SOTA，说明MemoraX AI的技术已经站在了全球前沿。

此外，MemoraX AI还联合牛津大学，做了两件影响深远的事：

第一，联合牛津大学构建并开源了基于真实剧本的Agent Memory评测基准ScriptMem。 在这个评测中，MemoraX取得60.3%的正确率，比第二名提升40%。这标志着大模型记忆在真实生活类场景应用上迈出了重要一步。

第二，联合牛津大学构建并开源了Coding领域的Agent Memory评测基准SWE-context-bench。 在这个评测中，MemoraX取得45%的任务解决率，比第二名提升50%。这意味着在编程生产力工具类应用上，大模型记忆技术取得了里程碑式突破。

更让人印象深刻的是学术成果输出——围绕大模型强化学习后训练、Test-Time Scaling等核心技术方向，MemoraX AI联合国内多家知名高校协同创新，共有10篇论文入选国际机器学习顶会ICML 2026。这个数字对于一家创立仅两个月的公司来说，堪称惊人。

与此同时，MemoraX AI创始团队还凭借在智能决策基础理论上的突破，获得了中国电子学会自然科学一等奖。

四、商业化方向：B端+C端双轮驱动

技术落地需要场景。MemoraX AI的商业化方向，分为B端和C端两条腿走路。

B端方向：赋能企业知识管理与专业领域知识库的智能化升级。具体场景包括：工作助手、知识管理、代码开发、智能客服、大模型安全等。这些场景都有一个共同特点——需要AI具备长期记忆能力，能够在不同时间、不同会话中保持上下文一致。

C端方向：打造面向个人用户的个性化智能助手。与B端企业客户相比，C端用户更需要”懂我”的AI——记得我的偏好、记得我的工作习惯、记得我关心的事项。MemoraX AI计划在未来12个月内推出首款C端消费级记忆智能终端产品。

据公司披露，该产品将具备主动记录、语义化存储、情景化回忆及情感演化等独特功能，真正实现”让AI成为用户的第二大脑”。

此外，公司已启动与多家三甲医院认知中心、在线教育平台及企业知识管理系统的试点合作，探索记忆智能在轻度认知障碍早期干预、个性化学习路径规划以及企业隐性知识传承等场景中的应用价值。

五、行业意义：从”外挂记忆”到”内生记忆”

MemoraX AI的出现，对整个AI行业具有标志性意义。

当前，业内解决大模型”失忆”的主流方案是RAG（检索增强生成）——通过外挂向量数据库，让大模型在回答问题前先检索相关信息。这种方案简单有效，但存在明显局限：每次对话仍需重新检索、无法真正理解上下文关联、检索质量受限于向量化的准确性。

MemoraX AI选择的”内生记忆”路径，则是从根本上让大模型自己学会记忆。这条路技术难度更高，但天花板也更高——一旦成功，AI将真正具备类似人类的连续学习和经验积累能力。

达泰资本在投资决策时特别强调，MemoraX AI在记忆建模层面的原创性与工程化落地能力是其最核心的竞争力。这两个能力缺一不可——只有原创性，技术才能持续领先；只有工程化落地，学术成果才能转化为产品。

六、竞争格局：大模型记忆赛道升温

MemoraX AI并非唯一看到这个机会的玩家。

2026年以来，随着大模型竞争进入”商业化下半场”，”记忆能力”成为各方关注的焦点。无论是OpenAI、Anthropic这样的海外巨头，还是国内的百度、阿里、字节，都在探索让大模型”记得更多、记得更久”的技术方案。

但MemoraX AI的特殊之处在于，它的切入点更底层——不是做应用层，而是深入到模型训练的后训练阶段，把记忆能力做进模型的”骨子里”。

这种技术路线，与当前大多数AI公司的”应用创新”路线形成了鲜明对比。可以说，MemoraX AI正在做一个”基础设施”级别的事情——如果成功，它的技术方案可能成为未来所有大模型的”标配”。

互动话题

大模型”失忆症”真的是AGI的绊脚石吗？你认为”内生记忆”和”外挂检索”哪种技术路线更有前景？欢迎在评论区聊聊你的看法。

七、技术原理解析：为什么大模型记不住

要理解MemoraX AI做的事情，先要理解为什么大模型会”失忆”。

当前的大语言模型，基于Transformer架构，训练时使用的是”next token prediction”范式——给定一段文本，预测下一个词应该是什么。这种范式让模型学会了”生成”，但没有让模型学会”存储”。

当模型训练完成后，它的参数就固定了。所有在训练过程中没有见过的信息，模型都无法知道；而即使是在训练中见过的信息，随着新训练的进行，也会产生”灾难性遗忘”——新学会的知识覆盖旧知识。

这就是为什么ChatGPT每次对话都是”从零开始”。不是因为它不想记住，而是它的架构本身就不支持记忆功能。

RAG方案通过外挂向量数据库解决了”信息获取”的问题，但无法解决”理解与整合”的问题。模型仍然是在做检索，而不是真正”记住所学”。

MemoraX AI的Agentic RL路径，则是从根本上改变这一点——让模型在强化学习过程中，学会区分什么值得记忆、什么可以遗忘、如何高效地存储和提取记忆信息。这条路线的核心难点在于：记忆存储和提取，不能干扰模型原本的生成能力。

这是一个极其精细的平衡，也是为什么全球范围内真正做这件事的团队屈指可数。

八、未来展望：12个月内的产品计划

技术最终要落地成产品。

MemoraX AI披露的规划显示，公司计划在未来12个月内推出首款面向C端用户的消费级记忆智能终端产品。该产品将具备四大核心功能：

主动记录：AI能够主动捕捉用户的关键信息，无需手动输入。

语义化存储：不是简单的文本存储，而是理解信息含义后进行结构化存储。

情景化回忆：能够根据用户当前场景，主动调用相关记忆。

情感演化：记忆会随着时间推移”进化”，与用户的关系越来越”懂你”。

与此同时，B端的标准化产品也在加速落地。公司正在与多家三甲医院认知中心、在线教育平台及企业知识管理系统推进试点合作，探索在医疗、教育、企业知识管理等领域应用。

如果这些产品能够按计划落地，MemoraX AI有望成为”AI时代记忆基础设施”的核心供应商。这个市场空间有多大？仅企业知识管理市场，2026年全球规模就已超过400亿美元。

而一旦个人消费级产品成熟，这个数字将成倍放大。

九、投资逻辑：为什么资本看好这个赛道

中金资本、达泰资本、华业天成三家头部机构联合领投，背后的投资逻辑值得分析。

第一，市场空间足够大。 大模型”失忆”不是某个具体产品的缺陷，而是整个行业的基础性问题。这意味着MemoraX AI做的不是一个小众市场，而是几乎所有大模型客户都需要的基础能力。

第二，技术壁垒足够高。 Agentic RL涉及强化学习、后训练、记忆建模等多个前沿领域的交叉，技术门槛极高。 MemoraX AI在LoCoMo-Refined上取得的82.65分SOTA，以及10篇ICML论文，都是技术实力的直接证明。

第三，差异化足够明显。 与其让大模型公司自己做记忆能力，不如做一个独立的”记忆层”。MemoraX AI的定位，是成为大模型记忆能力的”基础设施”，这个定位在当前的AI生态中几乎是空白。

达泰资本管理合伙人方元进一步表示：”MemoraX AI所定义的记忆智能，有望成为下一代通用人工智能的底层能力之一。这个判断，基于团队在记忆建模层面的原创性与工程化落地能力，也是我们见过的大模型记忆领域最踏实的团队。”

十、AGI路上，记忆为何如此重要

回到一个更本质的问题：为什么记忆对AGI如此重要？

人类智能的两个核心能力是”推理”和”记忆”。两者相互依存——没有记忆，推理就是无源之水；没有推理，记忆就是死数据。

当前的大模型，已经在”推理”端取得了突破性进展（GPT-5.5、Claude Opus都在推理能力上不断提升），但在”记忆”端，始终没有本质突破。

这意味着，当前的AI其实是”有智慧、无记忆”的智能体——每次对话都很聪明，但第二天就忘了你是谁；能够解决复杂问题，但无法积累经验成长。

MemoraX AI正在做的事情，就是补上这块短板。如果成功，AI将从”每次聪明的智能体”进化成”持续成长的智能体”。这或许是迈向AGI最关键的一步。

大模型”失忆症”有解了：前华为诺亚方舟主任创业，半年吸金超1亿，10篇论文助攻ICML

一、创始人背景：前华为诺亚方舟实验室主任创业

二、核心技术：Agentic RL攻克”失忆症”

三、技术成果：82.65分SOTA，10篇论文入选ICML

四、商业化方向：B端+C端双轮驱动

五、行业意义：从”外挂记忆”到”内生记忆”

六、竞争格局：大模型记忆赛道升温

互动话题

七、技术原理解析：为什么大模型记不住

八、未来展望：12个月内的产品计划

九、投资逻辑：为什么资本看好这个赛道

十、AGI路上，记忆为何如此重要

龙主编

我要评论

大模型”失忆症”有解了：前华为诺亚方舟主任创业，半年吸金超1亿，10篇论文助攻ICML

一、创始人背景：前华为诺亚方舟实验室主任创业

二、核心技术：Agentic RL攻克”失忆症”

三、技术成果：82.65分SOTA，10篇论文入选ICML

四、商业化方向：B端+C端双轮驱动

五、行业意义：从”外挂记忆”到”内生记忆”

六、竞争格局：大模型记忆赛道升温

互动话题

七、技术原理解析：为什么大模型记不住

八、未来展望：12个月内的产品计划

九、投资逻辑：为什么资本看好这个赛道

十、AGI路上，记忆为何如此重要

微信分享

龙主编

相关推荐

我要评论

扫码关注