腾讯开源 Agent Memory：上下文卸载 + Mermaid 任务画布，Token 消耗降低 61%

标签: AI Agent / 腾讯开源 / 上下文管理 / Token 优化 / Mermaid
原文: 微信公众号「腾讯云」https://mp.weixin.qq.com/s/mKSTl44Ste3Oxh7REl8WqQ

核心亮点

腾讯云正式开源 TencentDB Agent Memory，通过「上下文卸载 + Mermaid 任务画布」技术，为 Agent 长任务场景提供记忆压缩与个性化能力。实测降低 Token 消耗最高 61%，同时提升长任务成功率。零外部依赖，SQLite 本地存储，兼容 OpenClaw 和 Hermes 等主流 Agent 框架。

解决了什么问题

Agent 在代码开发、网页搜索、研究分析等长链路任务中，大量工具调用、网页内容和中间结果会快速占满上下文窗口：

问题	后果
Token 成本上升	上下文窗口被填满，费用飙升
任务状态丢失	Agent 不知道自己走到哪了
推理稳定性下降	长历史中迷失，执行路径混乱
信息无法回溯	中间结果被压缩后无法找回原始数据

核心技术：上下文卸载

原理

每次工具调用结束后，完整结果写入外部文件（refs/*.md），上下文里只保留一行摘要和索引路径。

原始信息不再长期占据上下文窗口，但也没有被丢弃——按四层递进结构存储在外部：

层级	内容	位置
Level 0	完整工具返回原文	`refs/*.md`
Level 1	工具调用级摘要	`offload.jsonl`
Level 2	Mermaid 画布节点	`*.mmd`
Level 3	任务级索引（目标+状态）	上下文

核心原则

底层保留证据，高层保留结构。

Agent 日常只接触 Level 2–3 的轻量信息驱动任务推进，当画布摘要不足以支撑决策时：

通过 node_id 回溯 Level 1 的 JSONL 记录
仍不够则继续下钻到 Level 0 的完整原文

任何一层压缩都不是不可逆的黑盒——系统内每一条信息都可以沿索引链路 100% 找回。

核心技术：Mermaid 任务画布

问题

长任务里最危险的事，不是信息丢了，是 Agent 不知道自己走到哪了。

20 次工具调用之后，上下文里堆着一长串线性历史。Agent 能看到「做过什么」，但不容易判断：

哪些是并行分支？
哪些步骤有前置依赖？
当前处于哪个阶段？

解决方案

用 Mermaid Flowchart 把任务执行过程组织成一张可导航的任务画布。

为什么选 Mermaid？

GitHub 和技术文档广泛使用
主流大模型天然具备读写能力
纯文本格式，可持续更新
人类也可以直接渲染查看

效果：历史没有被压成一段不可恢复的摘要，变成了一张可以继续执行的地图——能折叠，也能展开。

实验数据

多任务连续 Session（非单题清空上下文）

指标	结果
Token 消耗降低	最高 61%
任务成功率	提升

Token 下降的同时成功率上升——上下文中的噪声减少后，模型注意力更集中在当前任务目标上。

消融实验

配置	Token 节省
仅卸载（无画布）	~15%
卸载 + Mermaid 画布	31%–33%

画布对 Token 节省有独立贡献，叠加后效果更显著。

开箱即用

适配主流框架

TencentDB Agent Memory 目前已适配：

✅ OpenClaw
✅ Hermes

一键安装（OpenClaw）

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb

零外部依赖

默认使用本地 SQLite 存储
所有中间产物（画布、摘要）均为人类可读的 Markdown/Mermaid 文件

进阶支持

支持接入腾讯云向量数据库 TCVDB，实现混合检索（BM25 + Vector）。

适用场景

场景	效果
代码开发长任务	减少上下文噪音，保持代码逻辑连贯
研究分析	长链路搜索调研，信息可逐层追溯
网页自动化	多步骤操作不怕中途迷失
客服/对话系统	个性化记忆沉淀，每次对话都在进步
多轮复杂任务	任务画布让 Agent 始终知道「走到哪了」

项目信息

属性	详情
项目名	TencentDB Agent Memory
GitHub	https://github.com/Tencent/TencentDB-Agent-Memory
厂商	腾讯云
开源重点	短期记忆压缩（即上下文卸载 + Mermaid 画布）
长期记忆	已于上月上线，免费使用
兼容框架	OpenClaw / Hermes
安装	`openclaw plugins install @tencentdb-agent-memory/memory-tencentdb`
存储	SQLite 本地（默认）/ TCVDB 向量数据库（进阶）
数据格式	Markdown / Mermaid / JSONL（人类可读）
Token 节省	最高 61%（实测）