编程 腾讯开源Agent Memory:上下文卸载+Mermaid任务画布,Token消耗降低61%

2026-05-14 15:31:52 +0800 CST views 5

腾讯开源 Agent Memory:上下文卸载 + Mermaid 任务画布,Token 消耗降低 61%

标签: AI Agent / 腾讯开源 / 上下文管理 / Token 优化 / Mermaid
原文: 微信公众号「腾讯云」https://mp.weixin.qq.com/s/mKSTl44Ste3Oxh7REl8WqQ


核心亮点

腾讯云正式开源 TencentDB Agent Memory,通过「上下文卸载 + Mermaid 任务画布」技术,为 Agent 长任务场景提供记忆压缩与个性化能力。实测降低 Token 消耗最高 61%,同时提升长任务成功率。零外部依赖,SQLite 本地存储,兼容 OpenClaw 和 Hermes 等主流 Agent 框架。


解决了什么问题

Agent 在代码开发、网页搜索、研究分析等长链路任务中,大量工具调用、网页内容和中间结果会快速占满上下文窗口:

问题后果
Token 成本上升上下文窗口被填满,费用飙升
任务状态丢失Agent 不知道自己走到哪了
推理稳定性下降长历史中迷失,执行路径混乱
信息无法回溯中间结果被压缩后无法找回原始数据

核心技术:上下文卸载

原理

每次工具调用结束后,完整结果写入外部文件(refs/*.md),上下文里只保留一行摘要和索引路径。

原始信息不再长期占据上下文窗口,但也没有被丢弃——按四层递进结构存储在外部:

层级内容位置
Level 0完整工具返回原文refs/*.md
Level 1工具调用级摘要offload.jsonl
Level 2Mermaid 画布节点*.mmd
Level 3任务级索引(目标+状态)上下文

核心原则

底层保留证据,高层保留结构。

Agent 日常只接触 Level 2–3 的轻量信息驱动任务推进,当画布摘要不足以支撑决策时:

  1. 通过 node_id 回溯 Level 1 的 JSONL 记录
  2. 仍不够则继续下钻到 Level 0 的完整原文

任何一层压缩都不是不可逆的黑盒——系统内每一条信息都可以沿索引链路 100% 找回。


核心技术:Mermaid 任务画布

问题

长任务里最危险的事,不是信息丢了,是 Agent 不知道自己走到哪了。

20 次工具调用之后,上下文里堆着一长串线性历史。Agent 能看到「做过什么」,但不容易判断:

  • 哪些是并行分支?
  • 哪些步骤有前置依赖?
  • 当前处于哪个阶段?

解决方案

用 Mermaid Flowchart 把任务执行过程组织成一张可导航的任务画布。

为什么选 Mermaid?

  • GitHub 和技术文档广泛使用
  • 主流大模型天然具备读写能力
  • 纯文本格式,可持续更新
  • 人类也可以直接渲染查看

效果:历史没有被压成一段不可恢复的摘要,变成了一张可以继续执行的地图——能折叠,也能展开。


实验数据

多任务连续 Session(非单题清空上下文)

指标结果
Token 消耗降低最高 61%
任务成功率提升

Token 下降的同时成功率上升——上下文中的噪声减少后,模型注意力更集中在当前任务目标上。

消融实验

配置Token 节省
仅卸载(无画布)~15%
卸载 + Mermaid 画布31%–33%

画布对 Token 节省有独立贡献,叠加后效果更显著。


开箱即用

适配主流框架

TencentDB Agent Memory 目前已适配:

  • OpenClaw
  • Hermes

一键安装(OpenClaw)

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb

零外部依赖

  • 默认使用本地 SQLite 存储
  • 所有中间产物(画布、摘要)均为人类可读的 Markdown/Mermaid 文件

进阶支持

支持接入腾讯云向量数据库 TCVDB,实现混合检索(BM25 + Vector)。


适用场景

场景效果
代码开发长任务减少上下文噪音,保持代码逻辑连贯
研究分析长链路搜索调研,信息可逐层追溯
网页自动化多步骤操作不怕中途迷失
客服/对话系统个性化记忆沉淀,每次对话都在进步
多轮复杂任务任务画布让 Agent 始终知道「走到哪了」

项目信息

属性详情
项目名TencentDB Agent Memory
GitHubhttps://github.com/Tencent/TencentDB-Agent-Memory
厂商腾讯云
开源重点短期记忆压缩(即上下文卸载 + Mermaid 画布)
长期记忆已于上月上线,免费使用
兼容框架OpenClaw / Hermes
安装openclaw plugins install @tencentdb-agent-memory/memory-tencentdb
存储SQLite 本地(默认)/ TCVDB 向量数据库(进阶)
数据格式Markdown / Mermaid / JSONL(人类可读)
Token 节省最高 61%(实测)

核心理念

Agent 的上下文窗口不应是一张无限堆叠的桌子,而应是一个有序的工作台。

腾讯云希望通过这套方案,为开发者提供一个更可靠、更透明的「第二大脑」——让 Agent 沉淀经验,让每一次交互都变成可复用的资产。


本文整理自微信公众号「腾讯云」,原文链接:https://mp.weixin.qq.com/s/mKSTl44Ste3Oxh7REl8WqQ

推荐文章

程序员出海搞钱工具库
2024-11-18 22:16:19 +0800 CST
HTML和CSS创建的弹性菜单
2024-11-19 10:09:04 +0800 CST
Golang Select 的使用及基本实现
2024-11-18 13:48:21 +0800 CST
H5端向App端通信(Uniapp 必会)
2025-02-20 10:32:26 +0800 CST
PHP解决XSS攻击
2024-11-19 02:17:37 +0800 CST
开发外贸客户的推荐网站
2024-11-17 04:44:05 +0800 CST
Elasticsearch 的索引操作
2024-11-19 03:41:41 +0800 CST
JavaScript 流程控制
2024-11-19 05:14:38 +0800 CST
15 个你应该了解的有用 CSS 属性
2024-11-18 15:24:50 +0800 CST
Vue3中如何进行异步组件的加载?
2024-11-17 04:29:53 +0800 CST
程序员茄子在线接单