Hermes彻底碾压OpenClaw?10周登顶全球Token消耗榜的AI Agent架构解析
标签: AI Agent / OpenClaw / Hermes / 架构对比 / 安全审计
原文: 微信公众号「技术领导力」https://mp.weixin.qq.com/s/NYTYi9ncsqiU_YL10KtRKg
项目: Nous Research Hermes
核心亮点
上周 Hermes 登顶 OpenRouter 全球应用 Token 消耗榜榜首,彻底超过了 OpenClaw。短短数月,Agent 江湖巨变。
Hermes 实力有多强?
OpenRouter 日榜数据(5月9日)
| 排名 | 项目 | 单日 Token 消耗 |
|---|---|---|
| 🥇 | Hermes | 2710 亿 |
| 🥈 | OpenClaw | 2450 亿 |
| 🥉 | Kilo Code | 1490 亿 |
| 4 | Claude Code | 792 亿 |
日榜才是真正反映开发者新增工作负载流向的指标,历史总量更多是惯性。
GitHub 数据
| 指标 | 数据 |
|---|---|
| ⭐ Star | 14 万(一个月内翻倍) |
| 🍴 Fork | 21.8k |
| 👥 贡献者 | 接近 1000 人 |
| ⏱️ 用时 | 从零到全球调用量第一,仅 10 周 |
上线时间:2026 年 2 月 25 日,短短 10 周内完成从零到登顶。
Hermes 调用量 TOP5 模型
有意思的是,在 Hermes 的模型调用量当中,排名前 5 的模型,四个是中国的模型:
| 排名 | 模型 | 来源 |
|---|---|---|
| 1 | 小米 MiMo-V2-Pro | 🇨🇳 中国 |
| 2 | MiniMax M2.7 | 🇨🇳 中国 |
| 3 | 英伟达 Nemotron 3 Super | 🇺🇸 美国 |
| 4 | 阶跃星辰 Step 3.5 Flash | 🇨🇳 中国 |
| 5 | 腾讯 Hy3 preview | 🇨🇳 中国 |
中国模型集体成为 Hermes 最大的"燃料供应商",在世界 AI 竞技舞台上大放异彩。
OpenClaw 的深层问题
要理解 Hermes 的崛起,得先搞清楚 OpenClaw 的弊端。
1. 效率问题
小米 MiMo 大模型负责人、被业界称为"AI 天才少女"的罗福莉,在 2026 年中关村论坛的圆桌对话中,对 OpenClaw 给出了相当客观的评价:
OpenClaw 在 Agent 框架设计层面是革命性的,但深度 Coding 场景下,OpenClaw 存在明显的效率问题,包括上下文窗口的浪费和推理成本偏高。
2. 安全问题(更严重)
2026 年 1 月,Argus 安全平台对 OpenClaw 完成首次正式审计,发现 512 个漏洞,其中 8 个被列为严重级别。
- OAuth 凭证以明文 JSON 存储
- 身份验证默认关闭
- WebSocket 连接不做来源校验
2026 年 3 月,四天之内爆出 9 个 CVE,其中一个 CVSS 评分 9.9,接近满分。
3. ClawHub 供应链攻击
Koi Security 扫描了 ClawHub 技能市场 2857 个技能文件,发现 341 个恶意条目,其中 335 个来自同一次协调攻击,代号 "ClawHavoc":
- 伪装成 Gmail、Slack、Notion 集成工具
- 实际上在窃取用户的加密货币钱包和浏览器存储的凭证
Gartner 直接发出正式警告,称 OpenClaw 对企业而言是不可接受的网络安全风险。
4. Token 消耗失控
OpenClaw 以 WebSocket 网关为核心,同时连接 50 多个消息平台,架构上天然存在持续的网络暴露面,推理链路长,Token 开销难以精确控制。
5. 记忆机制缺失
每次任务结束后状态归零,下次重头来过。这个问题叠加在一起,让很多开发者开始寻找替代方案。
Hermes 做对了什么?
Hermes 的架构选择,几乎是对 OpenClaw 每一个痛点的针对性回应。
1. 自我进化技能机制
每当一次任务涉及 5 个以上的工具调用,Hermes 会自动运行一次反思步骤,生成可复用的技能文件,下次遇到类似任务直接调用,不重复探索。
后台还有一个叫 Curator 的自动化进程,每周对表现不佳的技能条目进行评分和重写。
Nous Research 的内部测试显示:积累了 20 个以上自创技能的 Agent,完成同类任务的速度比全新实例快 40%。
2. 有限记忆机制
Hermes 有持久记忆层,任务之间的状态不会丢失。
这解决了 OpenClaw 每次"失忆"的问题,也让 Agent 在长周期任务中真正有了连续性。
3. 模型解耦
Hermes 不绑定任何特定模型,支持 OpenRouter 上的所有主流模型,包括中国的多个开源模型。
这种灵活性,让开发者可以根据任务类型和成本预算自由切换,不被单一供应商锁定。
4. 本地优先
没有持续对外暴露的 WebSocket 服务器,攻击面天然更小。
这一点在 OpenClaw 安全事件频发的背景下,对企业用户的吸引力尤其明显。
硬性门槛
Hermes 也有硬性门槛:它要求模型至少支持 64K 上下文窗口,低于这个阈值的模型会在复杂多步骤任务中静默失败或性能退化。
这是硬伤,选型前必须考虑清楚。
OpenClaw vs Hermes,该选哪个?
如果你从来没有用过 OpenClaw
可以直接上手 Hermes:
- 学习成本低
- 社区活跃,文档更新快
- 支持 20 个消息平台,涵盖绝大多数日常使用场景
- 自带 118 个内置技能库,上手即用,不需要从技能市场里碰运气
如果你已经在 OpenClaw 上积累了大量自定义技能
迁移成本需要认真评估。
Hermes 提供了 hermes claw migrate 命令,可以导入现有 OpenClaw 配置,但:
- 涉及平台专属 Webhook 的网关配置,目前仍需手动重新设置
- 技能迁移也不是全自动的
OpenClaw 的优势
| 优势 | 数据 |
|---|---|
| 社区技能 | 44000+ |
| 平台接入 | 50+ |
| GitHub 星标 | 370000 |
这是短期内任何项目都难以复制的积累。
NVIDIA 的 NemoClaw 企业版、Hostinger、腾讯云、AWS 的预配置镜像,也在持续降低 OpenClaw 的安全部署门槛。
对于已经在企业内部跑通 OpenClaw 流程的团队,换框架的代价可能远大于打补丁的代价。
谁能笑到最后?
Agent 赛道真正的挑战,始终是四件事:
- 稳定性
- 安全性
- Token 成本
- 生态协同
Hermes 在前三项上目前表现更好,但它只有 10 周历史,安全研究社区的注意力还没有完全转移过来,CVE 数量会随着用户规模增长而增加,这是规律。
OpenClaw 在生态上的领先,短期内无法被追平。
谁能持续解决这四个问题,谁就能在这个赛道上站稳。
写在最后
Agent 的本质,是把人从重复劳动里解放出来。但工具本身也在被选择、被淘汰、被迭代。
OpenClaw 用一个周末的项目点燃了整个行业的想象力,Hermes 用 10 周的时间证明了架构选择的力量。
这场竞争没有终点,因为真正的终点不是某个框架登顶榜单,而是每一个用 AI 工具的人,能把更多时间花在真正值得思考的事情上。
工具会变,这个方向不会变。
本文整理自微信公众号「技术领导力」,原文链接:https://mp.weixin.qq.com/s/NYTYi9ncsqiU_YL10KtRKg
作者:Mr.K | 编辑:Emma