5月16日,Nous Research正式发布Hermes Agent v0.14.0,这个被官方称为”The Foundation Release”的版本带来了前所未有的更新规模:808次代码提交、633个合并PR、1393个文件变更、165061行新增代码,545个问题被关闭(其中包括12个P0级紧急bug和50个P1级重要bug),共有215位社区贡献者参与。
这不是一次普通的版本迭代,而是开源Agent社区协同力量的集中爆发。215位开发者联手、633个PR合并——这个数字放在任何开源项目中都是一个令人印象深刻的成绩单。更值得注意的是,这215位贡献者中包括了”联合作者”,意味着一些开发者为代码仓库贡献了具有署名权的实质性代码片段,这在开源社区中是一种罕见的认可形式。
从时间维度看,距离上一次版本v0.13.0的发布只过去了不到两个月,但团队在如此短的时间内完成了如此大量的工作。这种高强度的迭代节奏,反应了开源社区对Hermes项目的关注度和参与热情。
一、xAI Grok登陆Hermes:SuperGrok OAuth一键接入,100万token上下文
xAI的Grok模型正式以SuperGrok OAuth提供商的身份登陆Hermes Agent。这是本次更新中最具话题性的新功能之一。
此前,用户想要在第三方工具中使用Grok,必须通过xAI官方API接口申请API key,并单独管理账单。SuperGrok订阅(xAI的付费会员服务)的用户虽然已经支付了使用费用,但这些订阅权益并不能直接无缝转移到其他工具中使用。v0.14.0彻底改变了这一局面——用户只需用自己的xAI账号登录Hermes,无需单独申请API key,无需单独结算账单,Grok直接融入Hermes的工作流。
更重磅的是,借助这条OAuth通道,Grok-4.3的上下文窗口从默认配置一跃提升至100万token。100万token意味着什么?可以,将一整个代码仓库、整本行业报告、整个研究语料库直接塞进单次prompt,Agent在处理复杂任务时不必再反复进行上下文窗口管理。对于需要处理大型代码库或长文本的分析场景,这是一个实质性的体验升级。
官方还贴心地提供了SSH隧道文档——对于那些通过远程服务器SSH连接Hermes的用户,在没有本地浏览器的情况下也能完成OAuth授权流程。这体现了开发者对实际工作场景的理解:很多开发者习惯在远程服务器上运行Hermes,但OAuth授权通常需要本地浏览器环境,SSH隧道文档解决了这个”最后一公里”的问题。
从市场竞争角度看,Grok的加入让Hermes的多模型支持更加完整。目前Hermes支持的模型提供商包括Nous Portal、OpenAI、Anthropic Claude、Google Gemini、MiniMax、小米MiMo、OpenRouter(200+模型)、NovitaAI、NVIDIA NIM等,涵盖了目前市场上主流的大语言模型服务商。Grok的加入进一步补全了xAI这一重要玩家的接入。
二、OpenAI兼容代理:一套订阅,所有工具都能用
v0.14.0引入了一个看似简单却意义深远的功能——hermes proxy。运行这条命令,本地会启动一个http://localhost:port端口,对外表现为标准的OpenAI兼容API,但背后实际调用的是用户在Hermes中已经登录的OAuth提供商:Claude Pro、ChatGPT Pro或SuperGrok。

这意味着什么?Codex CLI、Aider、Cline、Continue——所有这些期待OpenAI兼容端点的工具,现在直接使用你的现有订阅,无需任何API key,一套订阅所有工具通用。
这背后的逻辑非常务实:对于深度使用AI辅助编程的开发者而言,往往同时订阅了多个服务——Claude Pro、ChatGPT Pro、SuperGrok——但每个工具只能使用对应的官方客户端或API。通过hermes proxy,用户可以用一个订阅去驱动所有支持OpenAI兼容接口的工具,实现了订阅权益的最大化复用。
举例来说,一位开发者订阅了Claude Pro和ChatGPT Pro两个服务,之前只能在Anthropic的官方客户端使用Claude,在OpenAI的官方界面使用ChatGPT。现在通过hermes proxy,Aider、Cline、Codex这些第三方工具都可以调用Claude Pro的能力,实现了跨订阅的算力整合。
从技术角度看,这也是一次”统一抽象层”的胜利:不同的AI服务提供商有不同的接入方式、不同的认证体系、不同的接口规范,但最终它们都可以被抽象成一个统一的OpenAI兼容接口,下游工具无需关心背后的复杂性。
三、Twitter/X搜索能力升级:第一方集成,推特信息随手查
Hermes内置了第一方的X(Twitter)搜索工具x_search,无需安装额外技能包或自行对接API,直接在对话中搜索时间线、查找话题、提取特定帖子。认证方式二选一:用X账户OAuth登录,或直接提供API Key。
这个功能看似简单,但对于需要追踪AI行业动态、研究社交媒体舆情的用户而言,是一个非常实用的升级。之前想要让Agent访问Twitter内容,往往需要自行搭建第三方集成或购买付费的Twitter API访问权限,现在这一切都变成了开箱即用的原生能力。
在AI行业,Twitter/X是最重要的信息源之一——几乎所有的主流AI实验室、研究者和开发者都会在Twitter上分享最新动态、研究论文和产品更新。Hermes内置X搜索能力,意味着用户可以直接让Agent帮自己追踪特定的AI话题、竞品动态或技术趋势,而不需要在浏览器和AI助手之间来回切换。
四、Microsoft Teams全线打通:企业协作无缝对接
v0.14.0完成了Microsoft Teams的端到端集成——Graph认证体系、接收Teams事件的Webhook监听器、流水线插件运行时、对外发送消息的投递通道,全部原生支持。配置一次,即可在任何Teams频道、群聊或私信中与Hermes对话。
Microsoft Teams是企业级协作的核心工具之一,在很多企业中被用于日常沟通、项目管理、会议组织等场景。Hermes与Teams的深度集成,意味着企业用户可以直接在熟悉的Teams界面中调用AI助手,而无需切换到其他平台或工具。
这个集成的完整度值得关注:不仅仅是”发送消息”这样简单的能力,而是包含了完整的认证体系(Microsoft Graph)、事件监听(Webhook)、流水线处理和消息投递。这意味着企业IT团队可以将Hermes作为内部AI助手,无缝嵌入现有的企业协作流程。
对于正在推进AI Agent企业级部署的团队而言,Teams集成是一个重要的里程碑。此前,Slack、Discord等消费级即时通讯工具已经有了成熟的接入方案,但企业级市场的主流选择——Microsoft Teams——的支持一直是缺口。v0.14.0补上了这块拼图。
五、安装包”减肥”运动:重组件按需加载,pip install直接用
Hermes Agent正式登陆PyPI,只需一条命令即可安装:
但更关键的变革在于”减肥”。此前pip install hermes-agent会一次性拉取所有组件——每个消息平台的SDK、每种图像生成SDK、每个语音/TTS提供商,不管用户用不用全都装。这不仅占用了大量磁盘空间,还带来了潜在的供应链安全风险——每个依赖项都可能是攻击面。

v0.14.0彻底改变了这一逻辑:重组件(Slack/Matrix/飞书/钉钉适配器、hindsight客户端、codex app-server、Pixverse/Camofox/图像生成SDK、语音/TTS提供商)现在只在用户首次使用时才触发安装。[all]扩展包也做了相应精简,安装器会在某wheel不适配当前平台时自动降级到备选方案,同时供应链安全检查器会扫描每个安装环节是否存在不安全版本。
这一改变对用户体验的影响是立竿见影的:安装速度更快、磁盘占用更小、启动时加载的模块更少。对于在资源受限环境(如$5的VPS)运行Hermes的用户尤为重要——很多用户正是被”能在$5 VPS上运行”这个特性吸引,但也需要实际的低资源占用来保证流畅体验。
六、冷启动加速:启动时间缩短约19秒
启动速度是用户体验的关键瓶颈。v0.14.0对启动路径进行了大幅重构:重组件只在实际使用时才加载,模型目录优先从磁盘缓存读取,doctor检查项并行执行,chat -q直接跳过欢迎横幅。
官方数据显示,All-Platforms工具检测界面从原来的14秒直降至1.5秒以内,整体冷启动时间缩短约19秒。对于需要频繁启动Hermes的开发者而言,这19秒的节省是每天无数次累积的时间节约。
这种优化通常涉及对代码结构的深层重构——将同步加载改为惰性加载、优化模块导入顺序、缓存昂贵的I/O操作等。14秒到1.5秒的差距背后,是多个PR的持续优化积累。
更深层的意义在于,冷启动优化代表了Hermes从”能用”到”好用”的进化。当一个工具需要等待十几秒才能响应时,用户的使用节奏会被打断,交互体验的流畅度大打折扣。现在1.5秒的响应时间已经接近”即时”的感知阈值,用户几乎感受不到等待。
七、浏览器操作速度提升180倍
Hermes的浏览器控制能力在v0.14.0实现了质的飞跃:CDP(Chrome DevTools Protocol)调用从此前的每次新建DevTools连接改为复用一条持久连接,速度提升约180倍。原本需要”数秒/次”的操作现在毫秒级响应,真实场景中的页面交互几乎感觉不到延迟。
这个改进对于依赖浏览器自动化能力的用户而言意义重大——比如需要抓取网页内容、填写表单、截图、执行JavaScript等场景。之前每个操作都需要建立新的Chrome DevTools连接,开销巨大;现在复用一个持久连接,开销骤降。
180倍的提升是一个令人印象深刻数字。从技术角度,这意味着之前需要2秒完成的浏览器操作,现在只需要11毫秒左右。这种速度提升不是通过算法优化实现的,而是通过架构层面的改进(持久连接vs每次新建连接)达成的。
八、消息平台再扩员:LINE和SimpleX Chat加入,平台总数达22个
LINE(日韩台最大即时通讯平台)和SimpleX Chat(主打隐私的无ID去中心化 messenger)正式以原生支持的身份加入Hermes大家族。
目前Hermes支持的独立消息平台已达22个,包括Telegram、Discord、Slack、WhatsApp、Signal、Matrix、飞书、钉钉、企业微信、QQ Bot、腾讯元宝、Microsoft Teams等,涵盖了个人、企业和特殊隐私场景的主流选择。
22个平台的覆盖意味着什么?无论用户使用哪个即时通讯工具,几乎都可以成为与Hermes交互的入口。这种广泛的支持是Hermes与其他AI助手差异化竞争的重要维度——很多AI助手只支持一两个主流平台,而Hermes几乎覆盖了所有主流场景。
LINE的加入尤其值得关注:LINE在日本、韩国和台湾地区是核心的日常通讯工具,拥有超过8000万的月活用户。SimpleX Chat则代表了隐私优先的用户群体——这是一个没有用户ID的去中心化 messenger,所有消息都是端到端加密,对于注重隐私的用户具有强烈吸引力。SimpleX的加入意味着Hermes已经将隐私保护纳入了平台支持的优先级。
九、会话接力(/handoff):对话上下文完整迁移
此前在对话中途切换模型或人格(Profile)意味着丢失上下文或重新开始。调试到一半想要换用深度推理模型继续分析?对不起,必须重新开始对话,上一段的上下文全部丢失。

新增的/handoff命令可以在不丢失任何内容的情况下,将当前活跃会话——包括每条消息、每次工具调用、每段上下文——实时移交给目标模型、人格或配置文件中。调试到一半可以直接从快速模型交接给深度推理模型,不同任务阶段也可以无缝传递给不同的Profile。
这个功能体现了对实际工作流的理解:在真实使用场景中,任务的不同阶段往往需要不同的模型能力——快速模型用于日常对话,深度推理模型用于复杂分析。”会话接力”功能让这种切换变得无缝,不需要任何手动复制粘贴操作。
举例而言,一位开发者正在用快速模型调试代码,发现了一个需要深入分析的bug,此时可以直接/handoff给深度推理模型继续分析,之前的所有对话历史和调试上下文完整保留。这大大提升了工作流的灵活性。
十、Claude跨会话1小时Prompt缓存:后台记忆调用也享折扣
通过Anthropic、OpenRouter或Nous Portal使用Claude时,Prompt前缀(系统提示词、Skills、记忆内容)现在会在一小时内跨会话复用。下次启动/new会话时,首条回复因为缓存仍然温热而响应更快、成本更低。
即使用户不主动发消息,后台的记忆整理任务调用也会命中缓存,不需要为每次整理支付全额费用。对于高频使用Hermes的用户而言,这是一个持续产生价值的优化——每个新会话都在一定程度上复用之前的工作成果。
从成本角度看,Claude的API费用是按token计费的,Prompt前缀的缓存复用意味着用户在每次新会话开始时不需要重新传输完整的系统提示词和记忆内容,这直接降低了使用成本。对于每天大量使用Hermes的用户群体,这项优化带来的成本节约是相当可观的。
十一、更多重磅更新一览
原生按钮UI:在Telegram和Discord上,Agent使用clarify工具向用户提问时,直接显示平台原生按钮而非文字选项编号,点一下即可回复,移动端体验大幅改善。
Discord频道历史回填:Hermes加入频道或线程时,自动读取近期消息历史,刚加入就知道之前说了什么。这意味着如果Hermes是在用户已经讨论了很长时间后才加入,依然能够理解对话的完整上下文。
视觉分析升级:vision_analyze现在将原始像素数据直接传给支持视觉的模型(GPT-5、Claude、Gemini、Grok-vision),不再经过文本描述中转,模型获得的是真正的原生视觉推理能力。之前Agent看到的其实是”这张图片描述的是一只猫”这样的文字转述,现在直接看到的是像素级信息,视觉理解更准确。
每次写文件附带变更验证:Agent每次写入或修改文件后,会自动获得一个简短的变更摘要(文件路径、行数差值、实际变更内容),Agent能第一时间发现”写了但没保存”或”被覆盖”这类静默失败。这解决了AI编程助手领域一个常见痛点——模型以为写入了文件,但实际上操作因为各种原因失败了。
LSP语义诊断:Agent使用write_file或patch后,Hermes现在会运行真实的语言服务器对编辑后的文件进行语义分析,将类型错误、未定义符号、缺失import等问题实时反馈给Agent。比v0.13.0的基础语法检查深刻得多——这是实际编译级别的检查,不是简单的字符串匹配。
统一视频生成接口:一个video_generate工具支持多个视频模型后端,新视频模型上线时只需一个插件文件即可接入,无需修改核心代码。这种”插件化架构”让Hermes的视频生成能力可以跟随社区的最新进展快速迭代。
computer_use扩展到非Anthropic模型:此前桌面控制能力(控制鼠标键盘操作GUI应用)仅支持Anthropic SDK,新的cua-driver后端现已支持非Anthropic模型,只要视觉能力足够,任何模型都能驱动你的桌面。这大大拓宽了desktop control能力的适用范围。
终端URL可点击:Agent输出中的链接现在在支持OSC8超链接的终端(iTerm2、Kitty、Ghostty、现代Windows Terminal等)中显示为可点击链接,无需再复制粘贴长URL。
Zed ACP Registry一键安装:Zed编辑器用户现在可以在Zed内一键安装Hermes,安装路径使用uvx,无需依赖npm。
OpenRouter Pareto代码路由器:min_coding_score配置项让用户为代码任务设定最低质量门槛,Hermes会自动选择该阈值以上最便宜的模型,避免为简单任务支付顶级模型费用。
NovitaAI新提供商:新增NovitaAI作为模型提供商,提供Llama、Qwen、DeepSeek等开源模型的托管服务。
原生Windows测试版:Windows原生支持从v0.14开始进入测试阶段,PowerShell一条命令即可安装。
十二、9个新可选技能包,丰富生态
v0.14.0还带来了9个新的可选Skills扩展包,涵盖更丰富的工具场景,进一步丰富了Hermes的技能生态。Skills系统是Hermes区别于其他AI助手的重要特性——它允许Agent在完成任务过程中自动沉淀可复用的技能,并在后续使用中持续优化。
这些Skills可以通过社区贡献获得,Hermes还与agentskills.io开放标准兼容,Skills可以在不同用户之间共享流通。这意味着一个用户创建的实用Skills可以分享给整个社区,形成良性的生态循环。
结语:开源Agent基础设施持续成熟
Hermes Agent v0.14.0的核心主题是”基础”——更轻量的安装、更快的启动、更高效的协作工具、更广泛的平台覆盖。从越用越聪明的自进化引擎,到跨平台的即时通讯桥接,再到企业级协作场景的全面打通,Hermes正在从一个”有趣的AI助手”演变为真正可持久运行的生产级Agent基础设施。
对于开发者和AI爱好者而言,这次更新的体验改善是立竿见影的——更快的启动、更轻的安装、更多的平台支持。对于企业用户而言,Teams集成、OpenAI兼容代理和Windows原生支持则让部署选项大大拓宽。
开源Agent赛道竞争持续升温。一个月前,Hermes刚以2710亿Token的日消耗量在OpenRouter榜单上超越OpenClaw登顶;如今v0.14.0的发布,展现了开源社区协同创新的巨大能量。215位贡献者、633个PR——这不是靠一个团队闭门开发能达到的规模。
真正的护城河不是功能堆砌,而是生态和社区。v0.14.0用数据证明了这一点。对于正在关注AI Agent发展的从业者而言,Hermes的持续进化提供了一个人间观察样本:开源社区如何能够在短时间内汇聚大量开发者资源,共同推进一个项目的快速迭代。这或许是AI时代技术发展的一种新范式。



我要评论