Hermes Agent 深度实战：自进化 AI Agent 的三层记忆架构与 Skill 自动生成完全指南（下篇）-程序员茄子

编程 Hermes Agent 深度实战：自进化 AI Agent 的三层记忆架构与 Skill 自动生成完全指南（下篇）

2026-06-04 04:45:35 +0800 CST views 420

接上篇

本文是《Hermes Agent 深度实战（下篇）》，上篇请见前文。

6. 自进化子系统之三：Reinforcement Learning from Experience

（本节深入讲解 Hermes Agent 的"经验库"构建、奖励信号设计、与 Model Fine-tuning 的协同）

6.1 经验库的构建

定义：经验库（Experience Replay Buffer）是指存储 Agent 的历史执行记录，并标注"好坏"的数据库。

为什么需要经验库？

在强化学习（Reinforcement Learning, RL）中，智能体通过"试错"学习。但在 AI Agent 的场景中，"试错"的成本很高（用户不会容忍 Agent 反复犯错）。因此，Hermes Agent 采用离线强化学习（Offline RL）——从历史上成功的执行案例中学习，而不是实时探索。

经验库的数据结构：

CREATE TABLE experiences (
    id INTEGER PRIMARY KEY,
    task_description TEXT NOT NULL,  -- 任务描述
    execution_trace TEXT NOT NULL,  -- 执行轨迹（工具调用序列 + 返回值）
    outcome TEXT NOT NULL,  -- "success" / "failure" / "partial_success"
    reward REAL NOT NULL,  -- 奖励信号（-1 到 +1）
    user_feedback TEXT,  -- 用户的自然语言反馈（如"还不错"、"这里错了"）
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    
    -- 用于快速检索
    task_type TEXT,  -- 如 "code_generation", "web_search", "data_analysis"
    difficulty INTEGER  -- 1-5，任务的难度等级
);

奖励信号的设计：

奖励信号（Reward）是强化学习的核心。Hermes Agent 采用多信号融合策略：

def compute_reward(execution_log, user_feedback=None):
    """计算执行日志的奖励信号"""
    rewards = {}
    
    # 信号 1：任务是否成功完成？
    rewards['success'] = 1.0 if execution_log.result == 'success' else -0.5
    
    # 信号 2：执行效率（耗时越短，奖励越高）
    max_acceptable_time = get_max_acceptable_time(execution_log.task_type)
    if execution_log.duration < max_acceptable_time:
        rewards['efficiency'] = 0.3
    else:
        rewards['efficiency'] = -0.1
    
    # 信号 3：用户反馈（如果有）
    if user_feedback:
        sentiment_score = analyze_sentiment(user_feedback)
        rewards['user_satisfaction'] = sentiment_score * 0.5
    
    # 信号 4：错误恢复能力（如果中途出错但最终成功，加分）
    error_count = count_errors(execution_log)
    if error_count > 0 and execution_log.result == 'success':
        rewards['error_recovery'] = 0.2
    
    # 加权求和
    weights = {'success': 0.5, 'efficiency': 0.2, 
               'user_satisfaction': 0.2, 'error_recovery': 0.1}
    final_reward = sum(rewards[k] * weights[k] for k in weights)
    
    return final_reward

6.2 从经验库中学习：Skill 优先级调整

Hermes Agent 不直接通过经验库来 Fine-tune 模型（那样成本太高），而是调整 Skill 的优先级。

核心思想：

如果某个 Skill 在历史执行中经常导致成功（高 reward），则提高它的 priority_score
如果某个 Skill 经常导致失败（低 reward），则降低它的 priority_score，甚至禁用

def update_skill_priorities(experience_db, skill_registry):
    """根据经验库更新 Skill 优先级"""
    
    conn = sqlite3.connect(experience_db)
    cursor = conn.cursor()
    
    for skill in skill_registry.list_skills():
        # 查询该 Skill 的历史表现
        cursor.execute("""
            SELECT AVG(reward) as avg_reward, COUNT(*) as usage_count
            FROM experiences
            WHERE execution_trace LIKE ?  -- 简化：假设 trace 中包含 Skill 名称
        """, (f'%{skill.name}%',))
        
        row = cursor.fetchone()
        if row and row[1] >= 5:  # 至少使用了 5 次才有统计意义
            avg_reward = row[0]
            
            # 更新优先级
            if avg_reward > 0.7:
                skill.priority_score = min(1.0, skill.priority_score + 0.1)
            elif avg_reward < 0.3:
                skill.priority_score = max(0.0, skill.priority_score - 0.2)
            
            # 持久化
            save_skill(skill)

6.3 与 Model Fine-tuning 的协同（高级话题）

虽然 Hermes Agent 主要通过"外部系统"（记忆 + Skill + Nudge）实现自进化，但在某些场景下，模型级别的 Fine-tuning 仍然有价值。

适用场景：

领域专业化：如果你的 Agent 专门用于某个垂直领域（如医疗、法律），可以用该领域的语料 Fine-tune 模型
风格个性化：如果用户希望 Agent 采用特定的回复风格（如"严肃专业" vs "幽默轻松"），可以 Fine-tune
多语言支持：如果 Agent 需要流利使用低资源语言，可以 Fine-tune

Hermes Agent 的 Fine-tuning 流程：

def prepare_finetuning_dataset(experience_db, min_reward=0.8):
    """从经验库中准备 Fine-tuning 数据集"""
    
    conn = sqlite3.connect(experience_db)
    cursor = conn.cursor()
    
    # 只选择高奖励的执行案例
    cursor.execute("""
        SELECT task_description, execution_trace
        FROM experiences
        WHERE reward >= ?
    """, (min_reward,))
    
    rows = cursor.fetchall()
    
    # 转换为 Fine-tuning 格式（假设使用 OpenAI Fine-tuning API）
    dataset = []
    for row in rows:
        dataset.append({
            "messages": [
                {"role": "user", "content": row[0]},
                {"role": "assistant", "content": format_execution_trace(row[1])}
            ]
        })
    
    # 保存到文件
    with open('finetuning_dataset.jsonl', 'w') as f:
        for item in dataset:
            f.write(json.dumps(item) + '\n')
    
    return len(dataset)

7. 代码实战：从零搭建自进化 Hermes Agent

（本节提供完整的实战代码，包括环境准备、配置三层记忆、编写第一个自进化 Skill、接入 Nudge Engine）

7.1 环境准备与安装

系统要求：

Python >= 3.10
SQLite3 >= 3.35（支持 FTS5）
可选：Ollama（本地运行模型）

安装步骤：

# 步骤 1：克隆仓库
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent

# 步骤 2：创建虚拟环境
python3 -m venv venv
source venv/bin/activate  # Linux/Mac
# 或
venv\Scripts\activate  # Windows

# 步骤 3：安装依赖
pip install -r requirements.txt

# 步骤 4：配置环境变量
cp .env.example .env
# 编辑 .env，填入你的 API Key（OpenAI / Anthropic / 本地 Ollama）

# 步骤 5：初始化数据库
python scripts/init_db.py

# 步骤 6：启动 Hermes Agent
python main.py

验证安装：

# 运行测试套件
pytest tests/

# 简单交互测试
echo "你好，请介绍一下你自己" | python main.py --interactive

7.2 配置三层记忆系统

目标：为你的项目配置三层记忆系统。

步骤 1：创建项目配置文件

# ~/.hermes/projects/my_project/config.yaml
project_name: "My Awesome Project"
tech_stack:
  - "Python"
  - "FastAPI"
  - "PostgreSQL"
  - "Redis"

coding_standards:
  - "使用 type hints"
  - "所有 API 必须有 OpenAPI 文档"
  - "数据库模型继承 BaseModel"

architecture_decisions:
  - "使用 Repository 模式隔离数据访问层"
  - "所有异步操作使用 asyncio"
  - "错误处理统一使用 CustomException 类"

步骤 2：注入到 MEMORY.md

# MEMORY.md - 项目记忆

## 项目：My Awesome Project

### 技术栈
- 后端：Python 3.11 + FastAPI
- 数据库：PostgreSQL 16
- 缓存：Redis 7
- 部署：Docker + Kubernetes

### 代码规范
1. 所有函数必须有 type hints
2. API 路由必须写 OpenAPI 文档（FastAPI 自动生成）
3. 数据库模型继承 BaseModel（SQLModel）

### 架构决策
- **为什么选择 FastAPI 而不是 Flask？**
  - 原生支持异步
  - 自动生成 API 文档
  - 内置数据验证（Pydantic）

- **为什么使用 Repository 模式？**
  - 隔离数据访问逻辑，方便单元测试
  - 切换数据库时只需修改 Repository 实现

### 已知坑点
- PostgreSQL 的 `SERIALIZABLE` 隔离级别在高并发下性能差，改用 `READ COMMITTED`
- Redis 的 `KEYS` 命令在生产环境会阻塞，改用 `SCAN`

步骤 3：验证记忆注入

# 测试脚本：验证记忆是否正确注入
from hermes.memory import MemoryManager

mm = MemoryManager(project="my_project")

# 模拟用户查询
user_query = "帮我写一个新的 API 端点"
relevant_memories = mm.retrieve_relevant(user_query)

print("检索到的相关记忆：")
for mem in relevant_memories:
    print(f"- {mem}")

7.3 编写第一个自进化 Skill

场景：你的项目经常需要"生成 FastAPI 端点 + Pydantic 模型 + 单元测试"，这是一个重复性很高的任务。

目标：创建一个 Skill，让 Hermes Agent 自动学会这个任务的最佳实践。

步骤 1：手动执行一次"标准流程"

# 假设你手动完成了以下工具调用序列：
# 1. 读取项目现有的 API 结构
existing_apis = read_file("/path/to/project/api/routes.py")

# 2. 生成新的 Pydantic 模型
new_model = generate_pydantic_model(model_name="UserCreate", fields=["username", "email", "password"])

# 3. 生成 FastAPI 端点
new_endpoint = generate_fastapi_endpoint(
    path="/users",
    method="POST",
    request_model="UserCreate",
    response_model="UserResponse"
)

# 4. 写入文件
write_file("/path/to/project/api/routes.py", existing_apis + "\n" + new_endpoint)

# 5. 生成单元测试
test_code = generate_unittest(endpoint="/users", method="POST")

# 6. 写入测试文件
write_file("/path/to/project/tests/test_api.py", test_code)

步骤 2：让 Hermes Agent 自动提炼 Skill

# 在任务执行成功后，调用 Skill 生成 API

execution_log = {
    "task": "创建新的 FastAPI 端点和 Pydantic 模型",
    "tool_calls": [
        {"tool": "read_file", "args": {"path": "/path/to/project/api/routes.py"}},
        {"tool": "generate_pydantic_model", "args": {"model_name": "UserCreate", ...}},
        {"tool": "generate_fastapi_endpoint", "args": {...}},
        {"tool": "write_file", "args": {...}},
        {"tool": "generate_unittest", "args": {...}},
        {"tool": "write_file", "args": {...}}
    ],
    "result": "success"
}

# 调用 Skill 生成
skill = hermes.skill_generator.generate_skill(execution_log)

print(f"生成的 Skill：{skill.name}")
print(f"描述：{skill.description}")

步骤 3：查看生成的 Skill

# ~/.hermes/skills/fastapi_endpoint_creator.yaml

name: "fastapi_endpoint_creator"
description: "为 FastAPI 项目创建新的端点和对应的 Pydantic 模型，并生成单元测试"

trigger_conditions:
  - "用户要求创建新的 API 端点"
  - "用户要求添加新的 FastAPI 路由"
  - "需要添加新的 RESTful API"

required_tools:
  - "read_file"
  - "write_file"
  - "generate_pydantic_model"
  - "generate_fastapi_endpoint"
  - "generate_unittest"

execution_steps:
  1: "读取项目现有的 API 路由文件（通常是 api/routes.py 或 api/v1/endpoints/）"
  2: "根据用户描述，生成 Pydantic 请求/响应模型"
  3: "生成 FastAPI 端点函数（包含路径参数、查询参数、依赖注入）"
  4: "将新端点追加到路由文件"
  5: "生成对应的单元测试（使用 pytest + httpx）"
  6: "将测试代码写入 tests/ 目录"

code_template: |
  # Pydantic 模型
  class {{model_name}}Base(SQLModel):
      {% for field in fields %}
      {{field.name}}: {{field.type}}
      {% endfor %}
  
  class {{model_name}}Create({{model_name}}Base):
      pass
  
  # FastAPI 端点
  @app.post("/{{endpoint_path}}", response_model={{model_name}}Response)
  async def create_{{model_name_snake}}(data: {{model_name}}Create, db: Session = Depends(get_db)):
      # 实现逻辑
      ...

test_cases:
  - "输入：POST /users with valid data；预期：201 Created"
  - "输入：POST /users with invalid email；预期：422 Validation Error"

步骤 4：测试 Skill

# 模拟触发 Skill
user_request = "帮我创建一个新的 API 端点：GET /products，返回产品列表"

# Hermes Agent 应该自动识别并加载 fastapi_endpoint_creator Skill
relevant_skills = hermes.tool_search(user_request)
assert "fastapi_endpoint_creator" in [s.name for s in relevant_skills]

# 执行任务
result = hermes.execute_task(user_request, skills=relevant_skills)

# 验证结果
assert result.status == "success"
assert "GET /products" in read_file("/path/to/project/api/routes.py")

7.4 接入 Nudge Engine

目标：让 Hermes Agent 在后台定时复盘，并生成改进建议。

步骤 1：配置 Nudge Engine

# ~/.hermes/config.yaml

nudge_engine:
  enabled: true
  
  # 浅度复盘频率（秒）
  lightweight_review_interval: 600  # 10 分钟
  
  # 深度复盘时间（cron 格式）
  deep_review_schedule: "0 3 * * *"  # 每天凌晨 3:00
  
  # 最大 Nudge 数量（防止 Context Window 爆满）
  max_nudges_in_prompt: 3
  
  # Nudge 过期时间（天）
  nudge_expiry_days: 30

步骤 2：启动 Nudge Engine

# 方式 1：作为后台进程启动
python -m hermes.nudge_engine --daemon

# 方式 2：使用 Hermes 内置的调度器
hermes scheduler add --name "Nudge Engine" --script "python -m hermes.nudge_engine" --schedule "*/10 * * * *"

步骤 3：查看生成的 Nudge

# 查看所有待应用的 Nudge
hermes nudge list --status pending

# 输出示例：
# ID: nudge_20260603_001
# 类型: error_prevention
# 优先级: high
# 内容: 当用户要求'安装 XXX'时，先检查系统是否已安装
# 证据: 2026-06-01 会话 #1234 中重复安装了 ffmpeg
# ---
# ID: nudge_20260603_002
# 类型: efficiency_optimization
# 优先级: medium
# 内容: 工具 web_fetch 调用耗时过长，考虑增加超时和重试逻辑

步骤 4：验证 Nudge 注入

# 启动新的会话，查看 System Prompt 是否包含 Nudge

session = hermes.create_session()
print(session.system_prompt)

# 应该看到类似这样的输出：
# ...
# ## 改进建议（自动生成）
# 1. 【high】当用户要求'安装 XXX'时，先检查系统是否已安装（运行 `which XXX`），避免重复安装
# 2. 【medium】工具 web_fetch 调用耗时过长，考虑增加超时和重试逻辑

7.5 完整实战案例：自动化的代码审查 Agent

场景：你希望 Hermes Agent 能够自动审查 Git 仓库中的 Pull Request，检查代码质量、安全性、性能问题。

实现步骤：

步骤 1：配置 GitHub Webhook

# 在 GitHub 仓库设置中，添加 Webhook：
# - Payload URL: https://your-hermes-gateway.com/webhooks/github
# - Events: Pull request (创建、更新)

步骤 2：编写代码审查 Skill

# ~/.hermes/skills/code_reviewer.yaml

name: "code_reviewer"
description: "自动审查 Pull Request 的代码质量"

trigger_conditions:
  - "收到 GitHub Pull Request Webhook"
  - "用户要求审查代码"

required_tools:
  - "github_api"
  - "git"
  - "static_analysis"  # pylint, flake8, etc.
  - "security_scan"  # bandit, etc.

execution_steps:
  1: "从 Webhook 中提取 PR 信息（仓库、分支、提交）"
  2: "克隆仓库并切换到 PR 分支"
  3: "运行静态分析工具（pylint、flake8）"
  4: "运行安全扫描工具（bandit）"
  5: "检查代码覆盖率是否下降"
  6: "生成审查报告（Markdown 格式）"
  7: "通过 GitHub API 提交审查意见（PR Comment）"

步骤 3：实现 Webhook 处理

# hermes/webhooks/github.py

from fastapi import FastAPI, Request
import hmac
import hashlib

app = FastAPI()

@app.post("/webhooks/github")
async def github_webhook(request: Request):
    # 验证 Webhook 签名
    body = await request.body()
    signature = request.headers.get("X-Hub-Signature-256")
    if not verify_signature(body, signature):
        return {"error": "Invalid signature"}, 401
    
    # 解析 Webhook 负载
    payload = await request.json()
    
    if payload["action"] in ["opened", "synchronize"]:
        # 新 PR 或 PR 更新
        pr_info = {
            "repo": payload["repository"]["full_name"],
            "pr_number": payload["pull_request"]["number"],
            "head_sha": payload["pull_request"]["head"]["sha"]
        }
        
        # 触发代码审查
        hermes.execute_task(
            task=f"审查 Pull Request #{pr_info['pr_number']}",
            context={"github_pr": pr_info},
            skills=["code_reviewer"]
        )
    
    return {"status": "ok"}


def verify_signature(body, signature):
    """验证 GitHub Webhook 签名"""
    secret = os.getenv("GITHUB_WEBHOOK_SECRET")
    expected = "sha256=" + hmac.new(secret.encode(), body, hashlib.sha256).hexdigest()
    return hmac.compare_digest(expected, signature)

步骤 4：运行测试

# 启动 Hermes Gateway
hermes gateway start

# 提交一个测试 PR
git checkout -b test-pr
echo "print('hello')" > test.py
git add test.py
git commit -m "测试 PR"
git push origin test-pr
gh pr create --title "测试代码审查" --body "请审查此 PR"

# 观察 Hermes Agent 的自动审查
# 应该会在 PR 中自动添加 Comment，包含静态分析结果、安全扫描结果等

8. 与其他 Agent 框架的深度对比

8.1 Hermes vs OpenClaw

维度	Hermes Agent	OpenClaw
记忆系统	三层架构（会话/持久/技能），SQLite + FTS5	两层（MEMORY.md / USER.md），基于文件
自进化能力	强（Skill 自动生成 + Nudge Engine）	弱（需要手动编写 Skill）
多平台支持	Gateway 架构，支持 10+ 平台	同样支持多平台
学习曲线	较陡（需要理解三层记忆、Skill、Nudge）	较平缓（基于文件的配置更直观）
适用场景	长期协作、复杂任务、需要"成长"的 Agent	快速原型、简单任务、不需要"记忆"的场景

选择建议：

如果你是个人开发者，希望有一个"越用越懂你"的 AI 助手 → 选 Hermes Agent
如果你是团队，需要快速搭建一个多平台 Agent，且不关心"自进化" → 选 OpenClaw

8.2 Hermes vs LangGraph

维度	Hermes Agent	LangGraph
抽象层级	高层（开箱即用）	底层（需要自己编排 Graph）
状态管理	自动（三层记忆系统）	手动（需要定义 State Schema）
自进化	内置	需要自己实现
可视化	无	有（LangGraph Studio）
学习曲线	中等	较陡（需要理解 Graph、Node、Edge 概念）

选择建议：

如果你需要精细控制 Agent 的执行流程（如复杂的多步推理、人工审批节点） → 选 LangGraph
如果你希望 Agent 自动学习并优化 → 选 Hermes Agent

8.3 Hermes vs AutoGPT

维度	Hermes Agent	AutoGPT
自主性	中等（需要用户触发）	高（完全自主任务拆解）
记忆系统	三层架构，精心设计	简单（基于向量数据库的检索）
成本	低（优先使用小模型 + Tool Search）	高（每次都调用 GPT-4）
稳定性	高（有 Nudge Engine 防止重复错误）	低（容易陷入死循环）

选择建议：

如果你需要完全自主的 Agent，且不关心成本 → 选 AutoGPT
如果你关心成本、稳定性、长期协作 → 选 Hermes Agent

9. 生产级最佳实践

9.1 记忆系统的容量规划

问题：随着使用时间增长，持久记忆（SQLite 数据库）会越来越大，导致检索变慢。

解决方案：分层存储 + 定期归档。

def archive_old_memories(db_path, days_to_keep=90):
    """将 90 天前的记忆归档到冷存储（如 S3）"""
    conn = sqlite3.connect(db_path)
    cursor = conn.cursor()
    
    # 查询 90 天前的记忆
    cursor.execute("""
        SELECT * FROM session_summaries
        WHERE julianday('now') - julianday(created_at) > ?
    """, (days_to_keep,))
    
    old_memories = cursor.fetchall()
    
    # 归档到 JSON 文件（然后可以上传到 S3）
    with open(f'archive_{datetime.now().isoformat()}.json', 'w') as f:
        json.dump(old_memories, f)
    
    # 从数据库中删除
    cursor.execute("""
        DELETE FROM session_summaries
        WHERE julianday('now') - julianday(created_at) > ?
    """, (days_to_keep,))
    
    conn.commit()

9.2 Skill 的质量控制

问题：自动生成的 Skill 可能质量参差不齐，甚至会"误导" Agent。

解决方案：人工审核 + 自动化测试。

def review_skill(skill, mode="human"):
    """审核 Skill 的质量"""
    
    if mode == "human":
        # 弹出编辑器，让人工审核
        open_editor(skill.file_path)
        approved = ask_human("是否批准此 Skill？(y/n)")
        return approved == 'y'
    
    elif mode == "auto":
        # 运行 test_cases
        all_passed = run_test_cases(skill.test_cases)
        
        # 检查代码模板是否有语法错误
        syntax_ok = check_syntax(skill.code_template)
        
        return all_passed and syntax_ok

9.3 Nudge Engine 的频率调优

问题：如果 Nudge Engine 运行太频繁，会消耗大量 API 调用；如果运行太少，Agent 学习太慢。

解决方案：动态调整频率。

def adjust_nudge_frequency(recent_performance):
    """根据近期表现动态调整 Nudge Engine 频率"""
    
    # 如果近期错误率较高，增加复盘频率
    if recent_performance.error_rate > 0.2:
        return 300  # 每 5 分钟一次
    
    # 如果近期表现良好，降低频率
    elif recent_performance.success_rate > 0.95:
        return 3600  # 每 1 小时一次
    
    else:
        return 600  # 默认 10 分钟

9.4 安全与权限控制

问题：Hermes Agent 有执行任意代码的能力（通过 exec 工具），如果不加限制，可能导致安全事故。

解决方案：工具白名单 + 沙箱执行。

# ~/.hermes/config.yaml

security:
  # 允许的工具（白名单）
  allowed_tools:
    - "web_fetch"
    - "read_file"
    - "write_file"
    - "exec"  # 但需要沙箱
  
  # 禁止的命令（即使在 exec 中）
  forbidden_commands:
    - "rm -rf /"
    - "dd if=/dev/zero"
    - "mkfs"
  
  # 沙箱配置
  sandbox:
    enabled: true
    backend: "docker"  # 或 "e2b" / "modal"
    timeout: 60  # 秒

10. 性能优化：让自进化更快、更稳

10.1 Prompt Cache 策略

问题：每次会话都要重新加载 System Prompt（可能包含大量记忆和 Skill 描述），导致首 token 延迟高。

解决方案：Prompt Caching（支持 Claude、Gemini）。

def enable_prompt_caching(system_prompt):
    """为 System Prompt 启用缓存"""
    
    # Anthropic Claude 的 Prompt Caching API
    response = anthropic_client.messages.create(
        model="claude-3-5-sonnet-20241022",
        max_tokens=4096,
        system=[
            {
                "type": "text",
                "text": system_prompt,
                "cache_control": {"type": "ephemeral"}  # 缓存 5 分钟
            }
        ],
        messages=[...]
    )
    
    return response

10.2 记忆检索的向量化

问题：FTS5 全文搜索对于"语义相似"的查询效果不好（如用户问"怎么优化数据库"，但记忆中存的是"PostgreSQL 性能调优"）。

解决方案：混合检索（FTS5 + 向量相似度）。

def hybrid_search(query, db_path, top_k=5):
    """FTS5 + 向量相似度的混合检索"""
    
    # 第一步：FTS5 全文搜索
    fts_results = fts_search(query, db_path, limit=20)
    
    # 第二步：向量相似度重排序
    query_embedding = embed_model.encode(query)
    
    scored_results = []
    for doc in fts_results:
        doc_embedding = embed_model.encode(doc.content)
        sim = cosine_similarity(query_embedding, doc_embedding)
        scored_results.append((doc, sim))
    
    # 返回 top-k
    scored_results.sort(key=lambda x: x[1], reverse=True)
    return [doc for doc, sim in scored_results[:top_k]]

10.3 Skill 加载的懒加载机制

问题：即使使用了 Tool Search，如果 Skill 的代码模板很长（如包含大量示例代码），仍然会占用大量 Context Window。

解决方案：只加载 Skill 的"摘要"，需要时再加载"完整版"。

def lazy_load_skill(skill_name, load_full=False):
    """懒加载 Skill"""
    
    skill = load_skill_metadata(skill_name)
    
    if not load_full:
        # 只返回摘要（trigger_conditions + description）
        return {
            "name": skill.name,
            "description": skill.description,
            "trigger_conditions": skill.trigger_conditions
        }
    
    else:
        # 返回完整 Skill（包括代码模板）
        return skill

11. 未来展望：自进化 Agent 的下一个前沿

11.1 多 Agent 协作中的自进化

目前的 Hermes Agent 主要关注"单 Agent 的自进化"。但未来的方向是多 Agent 系统，其中每个 Agent 都有自己的记忆和 Skill，并且能够通过协作学习彼此的 Skill。

研究问题：

如何设计一个"Skill 市场"，让 Agent 可以共享和交易 Skill？
如何防止恶意的 Skill 传播（类似计算机病毒）？

11.2 跨模态记忆

目前的记忆系统主要处理文本。但未来的 Agent 需要处理图像、音频、视频等多模态输入。

技术挑战：

如何统一表示多模态记忆？
如何在检索时融合不同模态的相似度？

11.3 在线强化学习

目前的 Hermes Agent 主要采用"离线学习"（从历史事件中学习）。但未来的方向是在线学习——Agent 能够在执行任务的过程中实时调整策略。

风险：在线学习可能导致 Agent "跑偏"（如学会欺骗用户来获得高奖励）。如何设计安全的在线学习算法，是一个开放问题。

12. 总结

Hermes Agent 通过三层记忆架构、Dynamic Skill Generation、Nudge Engine 三大子系统，实现了 AI Agent 的自进化能力。这使得 Agent 不再是"一次性工具"，而是能够"成长"的长期协作伙伴。

核心要点回顾：

三层记忆架构：会话记忆（工作记忆）、持久记忆（跨会话事实库）、技能记忆（可复用模式）
Dynamic Skill Generation：从成功的执行案例中自动提炼 Skill，并通过 Tool Search 实现渐进式加载
Nudge Engine：定时复盘执行日志，生成改进建议，并注入到后续会话的 System Prompt
生产级最佳实践：容量规划、质量控制、安全权限、性能优化

下一步行动：

如果你还没尝试过 Hermes Agent，可以从 GitHub 仓库克隆代码，按照第 7 节的实战指南搭建自己的自进化 Agent
如果你已经在用 Hermes Agent，可以尝试编写自己的 Skill，并接入 Nudge Engine
如果你对自进化 Agent 的研究感兴趣，可以关注 Hermes Agent 的 Roadmap

参考资料：

Hermes Agent GitHub: https://github.com/NousResearch/hermes-agent
Nous Research 官方博客: https://nousresearch.com/blog
三层记忆架构论文: "Memory Systems for Long-term Agent-Human Collaboration" (2026)
Tool Search 算法: "Efficient Tool Retrieval for Large Language Models" (2026)

本文写于 2026 年 6 月，基于 Hermes Agent v2.1.0。如有任何问题或建议，欢迎在 GitHub 提 Issue。

字数统计：约 18,500 字

代码示例数量：15 个

实战案例：从零搭建自进化 Agent、自动化代码审查 Agent

适合读者：有 Python 基础的 AI 开发者、对 Agent 框架感兴趣的研究者、希望提升 AI 助手能力的产品经理

编程 Hermes Agent 深度实战：自进化 AI Agent 的三层记忆架构与 Skill 自动生成完全指南（下篇）

接上篇

6. 自进化子系统之三：Reinforcement Learning from Experience

6.1 经验库的构建

6.2 从经验库中学习：Skill 优先级调整

6.3 与 Model Fine-tuning 的协同（高级话题）

7. 代码实战：从零搭建自进化 Hermes Agent

7.1 环境准备与安装

7.2 配置三层记忆系统

7.3 编写第一个自进化 Skill

7.4 接入 Nudge Engine

7.5 完整实战案例：自动化的代码审查 Agent

8. 与其他 Agent 框架的深度对比

8.1 Hermes vs OpenClaw

8.2 Hermes vs LangGraph

8.3 Hermes vs AutoGPT

9. 生产级最佳实践

9.1 记忆系统的容量规划

9.2 Skill 的质量控制

9.3 Nudge Engine 的频率调优

9.4 安全与权限控制

10. 性能优化：让自进化更快、更稳

10.1 Prompt Cache 策略

10.2 记忆检索的向量化

10.3 Skill 加载的懒加载机制

11. 未来展望：自进化 Agent 的下一个前沿

11.1 多 Agent 协作中的自进化

11.2 跨模态记忆

11.3 在线强化学习

12. 总结

推荐文章