编程 Hermes彻底碾压OpenClaw？10周登顶全球Token消耗榜的AI Agent架构解析

2026-05-21 16:25:24 +0800 CST views 11

Hermes彻底碾压OpenClaw？10周登顶全球Token消耗榜的AI Agent架构解析

标签: AI Agent / OpenClaw / Hermes / 架构对比 / 安全审计
原文: 微信公众号「技术领导力」https://mp.weixin.qq.com/s/NYTYi9ncsqiU_YL10KtRKg
项目: Nous Research Hermes

核心亮点

上周 Hermes 登顶 OpenRouter 全球应用 Token 消耗榜榜首，彻底超过了 OpenClaw。短短数月，Agent 江湖巨变。

Hermes 实力有多强？

OpenRouter 日榜数据（5月9日）

排名	项目	单日 Token 消耗
🥇	Hermes	2710 亿
🥈	OpenClaw	2450 亿
🥉	Kilo Code	1490 亿
4	Claude Code	792 亿

日榜才是真正反映开发者新增工作负载流向的指标，历史总量更多是惯性。

GitHub 数据

指标	数据
⭐ Star	14 万（一个月内翻倍）
🍴 Fork	21.8k
👥 贡献者	接近 1000 人
⏱️ 用时	从零到全球调用量第一，仅 10 周

上线时间：2026 年 2 月 25 日，短短 10 周内完成从零到登顶。

Hermes 调用量 TOP5 模型

有意思的是，在 Hermes 的模型调用量当中，排名前 5 的模型，四个是中国的模型：

排名	模型	来源
1	小米 MiMo-V2-Pro	🇨🇳 中国
2	MiniMax M2.7	🇨🇳 中国
3	英伟达 Nemotron 3 Super	🇺🇸 美国
4	阶跃星辰 Step 3.5 Flash	🇨🇳 中国
5	腾讯 Hy3 preview	🇨🇳 中国

中国模型集体成为 Hermes 最大的"燃料供应商"，在世界 AI 竞技舞台上大放异彩。

OpenClaw 的深层问题

要理解 Hermes 的崛起，得先搞清楚 OpenClaw 的弊端。

1. 效率问题

小米 MiMo 大模型负责人、被业界称为"AI 天才少女"的罗福莉，在 2026 年中关村论坛的圆桌对话中，对 OpenClaw 给出了相当客观的评价：

OpenClaw 在 Agent 框架设计层面是革命性的，但深度 Coding 场景下，OpenClaw 存在明显的效率问题，包括上下文窗口的浪费和推理成本偏高。

2. 安全问题（更严重）

2026 年 1 月，Argus 安全平台对 OpenClaw 完成首次正式审计，发现 512 个漏洞，其中 8 个被列为严重级别。

OAuth 凭证以明文 JSON 存储
身份验证默认关闭
WebSocket 连接不做来源校验

2026 年 3 月，四天之内爆出 9 个 CVE，其中一个 CVSS 评分 9.9，接近满分。

3. ClawHub 供应链攻击

Koi Security 扫描了 ClawHub 技能市场 2857 个技能文件，发现 341 个恶意条目，其中 335 个来自同一次协调攻击，代号 "ClawHavoc"：

伪装成 Gmail、Slack、Notion 集成工具
实际上在窃取用户的加密货币钱包和浏览器存储的凭证

Gartner 直接发出正式警告，称 OpenClaw 对企业而言是不可接受的网络安全风险。

4. Token 消耗失控

OpenClaw 以 WebSocket 网关为核心，同时连接 50 多个消息平台，架构上天然存在持续的网络暴露面，推理链路长，Token 开销难以精确控制。

5. 记忆机制缺失

每次任务结束后状态归零，下次重头来过。这个问题叠加在一起，让很多开发者开始寻找替代方案。

Hermes 做对了什么？

Hermes 的架构选择，几乎是对 OpenClaw 每一个痛点的针对性回应。

1. 自我进化技能机制

每当一次任务涉及 5 个以上的工具调用，Hermes 会自动运行一次反思步骤，生成可复用的技能文件，下次遇到类似任务直接调用，不重复探索。

后台还有一个叫 Curator 的自动化进程，每周对表现不佳的技能条目进行评分和重写。

Nous Research 的内部测试显示：积累了 20 个以上自创技能的 Agent，完成同类任务的速度比全新实例快 40%。

2. 有限记忆机制

Hermes 有持久记忆层，任务之间的状态不会丢失。

这解决了 OpenClaw 每次"失忆"的问题，也让 Agent 在长周期任务中真正有了连续性。

3. 模型解耦

Hermes 不绑定任何特定模型，支持 OpenRouter 上的所有主流模型，包括中国的多个开源模型。

这种灵活性，让开发者可以根据任务类型和成本预算自由切换，不被单一供应商锁定。

4. 本地优先

没有持续对外暴露的 WebSocket 服务器，攻击面天然更小。

这一点在 OpenClaw 安全事件频发的背景下，对企业用户的吸引力尤其明显。

硬性门槛

Hermes 也有硬性门槛：它要求模型至少支持 64K 上下文窗口，低于这个阈值的模型会在复杂多步骤任务中静默失败或性能退化。

这是硬伤，选型前必须考虑清楚。

OpenClaw vs Hermes，该选哪个？

如果你从来没有用过 OpenClaw

可以直接上手 Hermes：

学习成本低
社区活跃，文档更新快
支持 20 个消息平台，涵盖绝大多数日常使用场景
自带 118 个内置技能库，上手即用，不需要从技能市场里碰运气

如果你已经在 OpenClaw 上积累了大量自定义技能

迁移成本需要认真评估。

Hermes 提供了 hermes claw migrate 命令，可以导入现有 OpenClaw 配置，但：

涉及平台专属 Webhook 的网关配置，目前仍需手动重新设置
技能迁移也不是全自动的

OpenClaw 的优势

优势	数据
社区技能	44000+
平台接入	50+
GitHub 星标	370000

这是短期内任何项目都难以复制的积累。

NVIDIA 的 NemoClaw 企业版、Hostinger、腾讯云、AWS 的预配置镜像，也在持续降低 OpenClaw 的安全部署门槛。

对于已经在企业内部跑通 OpenClaw 流程的团队，换框架的代价可能远大于打补丁的代价。

谁能笑到最后？

Agent 赛道真正的挑战，始终是四件事：

稳定性
安全性
Token 成本
生态协同

Hermes 在前三项上目前表现更好，但它只有 10 周历史，安全研究社区的注意力还没有完全转移过来，CVE 数量会随着用户规模增长而增加，这是规律。

OpenClaw 在生态上的领先，短期内无法被追平。

谁能持续解决这四个问题，谁就能在这个赛道上站稳。

写在最后

Agent 的本质，是把人从重复劳动里解放出来。但工具本身也在被选择、被淘汰、被迭代。

OpenClaw 用一个周末的项目点燃了整个行业的想象力，Hermes 用 10 周的时间证明了架构选择的力量。

这场竞争没有终点，因为真正的终点不是某个框架登顶榜单，而是每一个用 AI 工具的人，能把更多时间花在真正值得思考的事情上。

工具会变，这个方向不会变。

本文整理自微信公众号「技术领导力」，原文链接：https://mp.weixin.qq.com/s/NYTYi9ncsqiU_YL10KtRKg
作者：Mr.K | 编辑：Emma

复制全文生成海报 AI Agent OpenClaw Hermes 架构对比安全审计