📚 AI 资讯

刚刚!两大开源AI Agent同天秀肌肉:一个升级GPU帝国,一个拿下16平台

· 2026-04-25 · 13 阅读

刚刚!两大开源AI Agent同天秀肌肉:一个升级GPU帝国,一个拿下16平台

👤 龙主编 📅 2026-04-25 👁️ 13 阅读 💬 0 评论

【AI智习室 4月25日报道】 刚刚过去的48小时,开源AI Agent领域炸开了锅——两大头部项目居然在同一天密集发布重磅更新。4月24日,OpenClaw发布v2026.4.23;4月22日,Hermes Agent连发8篇技术博客。两条新闻撞在一起,业界嗅到了熟悉的味道:军备竞赛开始了。

这不是巧合,这是AI助手赛道进入”平台期”后,各家被迫加速迭代的信号。当底层模型能力趋于同质化,谁能更好地把AI”分发”到用户的工作流里,谁就能赢得下一场战役。

导语

OpenClaw和Hermes Agent,一个是GitHub拿下31万星的开源AI网关,一个是Nous Research出品的自演进AI智能体。两条赛道原本各走各的路,却在4月下旬狭路相逢。

OpenClaw的更新集中在”能力扩展”——把GPT-5.5、图像生成、Codex集成一股脑塞进去;Hermes的更新集中在”连接扩展”——16个聊天平台、6种终端后端、MCP协议支持。两家的思路截然不同,但目标一致:让AI无处不在。

OpenClaw v2026.4.23:全力拥抱GPT-5.5

4月24日,OpenClaw发布v2026.4.23版本,更新内容密度堪称年度之最。

GPT-5.5全家桶支持

最大的看点是Pi包升级到0.70.0,全面接入GPT-5.5的catalog元数据。这意味着OpenClaw用户可以无感使用GPT-5.5系列模型,无需额外配置。配合Codex OAuth,开发者可以直接在OpenClaw内调用GPT-5.5进行编程任务。

图片生成:无需API Key

通过Codex OAuth,OpenClaw新增了GPT-Image-2图像生成和参考图编辑功能——全程不需要OPENAI_API_KEY。这意味着个人开发者可以零成本尝鲜图像生成能力,降低了创意AI的使用门槛。

OpenRouter用户也获得了相同的能力——通过image_generate工具,万象模型等OpenRouter支持的图像模型均可直接调用。

子进程隔离与超时控制

对于高级用户,OpenClaw新增了sessions_spawn的forked context支持,子进程可以继承调用者的 transcript,保持上下文连续性。同时,图片、视频、音频、TTS等生成工具新增per-call timeoutMs控制,避免单个任务卡死整个会话。

本地记忆模块也得到优化——memorySearch.local.contextSize现在可配置,默认4096 token,在低配机器上也能流畅运行。

OpenClaw界面

Hermes Agent:8连发,平台战一触即发

比OpenClaw更激进的是,Hermes Agent在4月22日当天一口气发布8篇技术博客,每篇对应一项重大更新。这种发布节奏在开源社区极为罕见。

16个聊天平台,一个网关

Hermes现在支持16个即时通讯平台:Telegram、Discord、WhatsApp、iMessage、WeChat、Matrix……从主流到小众,全部覆盖。用户只需部署一个网关,就能在任意平台上唤醒同一个AI助手。这对于需要跨平台协作的团队来说,是真正的效率革命。

6种终端后端:Local、Docker、SSH全覆盖

开发者场景下,Hermes支持6种终端执行后端:本地、 Docker、SSH、Modal、Daytona、Singularity。无论你的代码跑在本地笔记本、超算集群还是云端容器,都能无缝衔接。

浏览器自动化:Browserbase集成

Hermes接入了Browserbase,实现真浏览器自动化——页面导航、表单填写、点击操作、数据抓取、反爬虫绕过,全部可以配置化实现。对于需要批量操作网页的工作流,这个功能等于省去了大量Selenium脚本。

MCP协议:GitHub、数据库一键连接

Model Context Protocol(MCP)是这轮更新的隐藏大招。通过MCP,Hermes可以连接任意MCP服务器——GitHub代码仓库、MySQL数据库、本地文件系统、Slack频道——无需为每个数据源单独开发工具。协议即插即用,扩展性极强。

Skills Hub:AI技能的App Store

Hermes还上线了Skills Hub,这是面向AI Agent的技能市场。开发者可以上传、分发、搜索预建技能,其他用户一键安装。与OpenClaw的Skill生态不同,Hermes的Skills Hub更强调社区共创和垂直场景。

Hermes多平台接入

语音模式+安全加固+自定义皮肤

除了上述核心功能,Hermes还补齐了三个”体验型”更新:

语音模式:支持语音输入和语音播报,跨平台发送语音消息。对于开车、做饭等不便看手机的场景,这是刚需。

安全加固:新增沙箱隔离、密钥管理、权限分级和防prompt注入。部署在公网的AI助手终于有了企业级安全保障。

自定义皮肤:终端界面支持主题、ASCII art、配色方案自定义。极客们可以把AI终端打扮成自己喜欢的样子。

深度分析:两条路,一个终点

OpenClaw和Hermes的更新策略,折射出AI Agent赛道两条主流路线的分化。

OpenClaw走的是”能力纵深”路线:把更多的模型、更多的工具、更强的生成能力集成到自己的核心引擎里。它不关心你用什么聊天工具,只关心你能不能用AI完成更复杂的任务。

Hermes走的是”连接横扩”路线:把AI助手推送到尽可能多的聊天平台和工作环境里。它不关心你用什么模型,只关心你能不能在任何地方召唤AI。

两条路没有对错。当AI模型能力趋于平台期,竞争的焦点就从”谁更聪明”转向”谁更容易用到”。OpenClaw在赌,开发者会为了GPT-5.5和图像生成选择它;Hermes在赌,用户会为了”随时随地都在”选择它。

【金句】 AI Agent的终局不是”最聪明的那个”,而是”最无处不在的那个”。

最终,两条路会在同一个地方汇合——当OpenClaw接入了所有聊天平台,当Hermes支持了所有主流模型,谁能在体验上胜出,才是真正的胜负手。

核心功能对比

如果你正在两个平台之间犹豫,以下是关键差异:

功能 OpenClaw Hermes Agent
最新大模型 GPT-5.5(Pi 0.70.0) 多模型支持(含DeepSeek/Kimi)
平台覆盖 30+聊天平台 16个核心平台
终端后端 本地为主 6种(Local/Docker/SSH等)
图片生成 GPT-Image-2(免API Key) 需自行配置
浏览器自动化 基础能力 Browserbase深度集成
MCP协议 不支持 完整支持
技能市场 ClawHub Skills Hub
语音模式 基础TTS 完整语音交互
安全加固 企业级 沙箱+权限分级
开源协议 MIT MIT

总结

OpenClaw和Hermes同天发力,释放了一个明确信号:AI Agent赛道的平台期已经结束,垂直化、场景化、分散化的”生态战争”正式开打。

对于普通用户,这当然是好事——更好的工具、更低的门槛、更无处不在的AI。对于开发者,选择哪个平台将决定未来三年你的AI工作流走向何方。

选OpenClaw的理由:你需要最强的代码生成能力,你需要GPT-5.5,你需要图像生成,你需要本地记忆管理。

选Hermes的理由:你需要跨平台使用AI,你需要语音交互,你需要MCP协议连接各种数据源,你需要社区共享的技能市场。

当然,最理想的状态是两者都用——OpenClaw作为主力编程引擎,Hermes作为日常随身的智能助手。赛道的竞争,最终受益的还是用户。

互动话题

你更看好哪个AI Agent平台?

  • A. OpenClaw——代码能力强,GPT-5.5加持,开发者首选
  • B. Hermes——平台覆盖广,语音+MCP,日常生活首选
  • C. 两个都用——各司其职,生态互补
  • D. 都不选,等GPT-5官方下场

欢迎在评论区说说你的看法!

(本文由AI智习室原创,综合自OpenClaw GitHub、Hermes Agent官方博客等公开信息。未经授权禁止转载。)

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

微信公众号二维码

扫码关注公众号

QQ
QQ二维码

扫码添加QQ