腾讯开源 Agent Memory:上下文卸载 + Mermaid 任务画布,Token 消耗降低 61%
标签: AI Agent / 腾讯开源 / 上下文管理 / Token 优化 / Mermaid
原文: 微信公众号「腾讯云」https://mp.weixin.qq.com/s/mKSTl44Ste3Oxh7REl8WqQ
核心亮点
腾讯云正式开源 TencentDB Agent Memory,通过「上下文卸载 + Mermaid 任务画布」技术,为 Agent 长任务场景提供记忆压缩与个性化能力。实测降低 Token 消耗最高 61%,同时提升长任务成功率。零外部依赖,SQLite 本地存储,兼容 OpenClaw 和 Hermes 等主流 Agent 框架。
解决了什么问题
Agent 在代码开发、网页搜索、研究分析等长链路任务中,大量工具调用、网页内容和中间结果会快速占满上下文窗口:
| 问题 | 后果 |
|---|---|
| Token 成本上升 | 上下文窗口被填满,费用飙升 |
| 任务状态丢失 | Agent 不知道自己走到哪了 |
| 推理稳定性下降 | 长历史中迷失,执行路径混乱 |
| 信息无法回溯 | 中间结果被压缩后无法找回原始数据 |
核心技术:上下文卸载
原理
每次工具调用结束后,完整结果写入外部文件(refs/*.md),上下文里只保留一行摘要和索引路径。
原始信息不再长期占据上下文窗口,但也没有被丢弃——按四层递进结构存储在外部:
| 层级 | 内容 | 位置 |
|---|---|---|
| Level 0 | 完整工具返回原文 | refs/*.md |
| Level 1 | 工具调用级摘要 | offload.jsonl |
| Level 2 | Mermaid 画布节点 | *.mmd |
| Level 3 | 任务级索引(目标+状态) | 上下文 |
核心原则
底层保留证据,高层保留结构。
Agent 日常只接触 Level 2–3 的轻量信息驱动任务推进,当画布摘要不足以支撑决策时:
- 通过
node_id回溯 Level 1 的 JSONL 记录 - 仍不够则继续下钻到 Level 0 的完整原文
任何一层压缩都不是不可逆的黑盒——系统内每一条信息都可以沿索引链路 100% 找回。
核心技术:Mermaid 任务画布
问题
长任务里最危险的事,不是信息丢了,是 Agent 不知道自己走到哪了。
20 次工具调用之后,上下文里堆着一长串线性历史。Agent 能看到「做过什么」,但不容易判断:
- 哪些是并行分支?
- 哪些步骤有前置依赖?
- 当前处于哪个阶段?
解决方案
用 Mermaid Flowchart 把任务执行过程组织成一张可导航的任务画布。
为什么选 Mermaid?
- GitHub 和技术文档广泛使用
- 主流大模型天然具备读写能力
- 纯文本格式,可持续更新
- 人类也可以直接渲染查看
效果:历史没有被压成一段不可恢复的摘要,变成了一张可以继续执行的地图——能折叠,也能展开。
实验数据
多任务连续 Session(非单题清空上下文)
| 指标 | 结果 |
|---|---|
| Token 消耗降低 | 最高 61% |
| 任务成功率 | 提升 |
Token 下降的同时成功率上升——上下文中的噪声减少后,模型注意力更集中在当前任务目标上。
消融实验
| 配置 | Token 节省 |
|---|---|
| 仅卸载(无画布) | ~15% |
| 卸载 + Mermaid 画布 | 31%–33% |
画布对 Token 节省有独立贡献,叠加后效果更显著。
开箱即用
适配主流框架
TencentDB Agent Memory 目前已适配:
- ✅ OpenClaw
- ✅ Hermes
一键安装(OpenClaw)
openclaw plugins install @tencentdb-agent-memory/memory-tencentdb
零外部依赖
- 默认使用本地 SQLite 存储
- 所有中间产物(画布、摘要)均为人类可读的 Markdown/Mermaid 文件
进阶支持
支持接入腾讯云向量数据库 TCVDB,实现混合检索(BM25 + Vector)。
适用场景
| 场景 | 效果 |
|---|---|
| 代码开发长任务 | 减少上下文噪音,保持代码逻辑连贯 |
| 研究分析 | 长链路搜索调研,信息可逐层追溯 |
| 网页自动化 | 多步骤操作不怕中途迷失 |
| 客服/对话系统 | 个性化记忆沉淀,每次对话都在进步 |
| 多轮复杂任务 | 任务画布让 Agent 始终知道「走到哪了」 |
项目信息
| 属性 | 详情 |
|---|---|
| 项目名 | TencentDB Agent Memory |
| GitHub | https://github.com/Tencent/TencentDB-Agent-Memory |
| 厂商 | 腾讯云 |
| 开源重点 | 短期记忆压缩(即上下文卸载 + Mermaid 画布) |
| 长期记忆 | 已于上月上线,免费使用 |
| 兼容框架 | OpenClaw / Hermes |
| 安装 | openclaw plugins install @tencentdb-agent-memory/memory-tencentdb |
| 存储 | SQLite 本地(默认)/ TCVDB 向量数据库(进阶) |
| 数据格式 | Markdown / Mermaid / JSONL(人类可读) |
| Token 节省 | 最高 61%(实测) |
核心理念
Agent 的上下文窗口不应是一张无限堆叠的桌子,而应是一个有序的工作台。
腾讯云希望通过这套方案,为开发者提供一个更可靠、更透明的「第二大脑」——让 Agent 沉淀经验,让每一次交互都变成可复用的资产。
本文整理自微信公众号「腾讯云」,原文链接:https://mp.weixin.qq.com/s/mKSTl44Ste3Oxh7REl8WqQ