3.2 万 Star 开源本地 AI 知识库:Open Notebook 支持 18 家模型 + 播客生成 + MCP 集成
标签: AI知识库 / 开源 / RAG / 播客 / MCP / Ollama / DeepSeek / 本地部署 / 隐私
原文: 微信公众号「极客之家」https://mp.weixin.qq.com/s/ACLLu6zMlnEgXcte7v1JYQ
GitHub: https://github.com/lfnovo/open-notebook
License: MIT
一句话定位
Open Notebook 是 Google Notebook LM 的开源替代品,3.2 万 Star,数据跑在本地,支持 18 家 AI 模型任意切换,还能生成多人播客。MIT 协议,完全免费,Docker 两分钟部署。
为什么需要 Open Notebook?
Google Notebook LM 很好用,但有几个硬伤:
| 问题 | Notebook LM | Open Notebook |
|---|---|---|
| 数据存储 | Google 服务器 | 本地硬盘 |
| 模型选择 | 只能用 Gemini | 18+ 家任意切换 |
| API 支持 | 无 | 完整 REST API |
| 自动化 | 无 | MCP 集成 |
| 播客 | 2 人、不可定制 | 1-4 人、完全自定义 |
| 开源 | ❌ | ✅ MIT |
核心功能
1. 支持 18+ AI 模型,随便切
通过 Esperanto 抽象层封装了 18 家提供商的接口,UI 里一键切换:
主流支持:OpenAI / DeepSeek / Claude / Ollama / Groq / Google / Mistral / Cohere 等
配置流程:Models → 选提供商 → 填 API Key → Test → Sync Models → 勾选启用
三种模型槽位:
- Chat Model:对话用
- Transformation Model:内容转换用
- Embedding Model:向量化用
零成本方案:接 Ollama 跑本地模型,API Key 都不用填。推理模型(DeepSeek-R1、Qwen3 带思考链)也支持。
不被供应商绑死:OpenAI 涨价了切 DeepSeek,Anthropic 挂了切 Groq,随时切换不耽误事。
2. 什么格式都能往里扔
| 格式 | 支持 |
|---|---|
| ✅ 直接拖 | |
| 音频文件 | ✅ |
| 视频文件 | ✅ |
| 网页链接 | ✅ |
| TXT / PPT / Word | ✅ |
资料丢进去后自动向量化和索引,处理完就能提问。不同项目建不同笔记本,互不干扰。
3. 播客生成:1-4 个 AI 说话人
| 对比 | Notebook LM | Open Notebook |
|---|---|---|
| 说话人数 | 2 人(固定) | 1-4 人(自选) |
| 音色定制 | ❌ | ✅ 每人单独设置 |
| 语言设置 | ❌ | ✅ 每人单独设置 |
| 脚本控制 | ❌ | ✅ Episode Profile |
| TTS 后端 | Google 内置 | ElevenLabs / OpenAI TTS / Google TTS / Edge-TTS |
每个说话人的音色、角色、语言都能单独设置。还能写 Episode Profile 定主题、风格、时长。想省钱白嫖 Edge-TTS 也行。
4. RAG 对话 + 来源标注
聊天不是简单关键词匹配,走的是 RAG 流程:
- 向量检索找到相关资料片段
- 片段塞进 LLM 上下文窗口生成回答
- 回答标注引用来源——哪个答案来自哪份资料的哪一段
实用小功能:每个资料来源旁有小灯泡,切换使用全文还是摘要。300 页 PDF 用摘要就够了,想深挖再切全文。
聊出的好内容可以 Save to note,进 Notes 面板回头翻阅。一个笔记本支持多个聊天会话,不同话题分开聊。
5. 双层搜索:全文 + 语义
| 搜索层 | 说明 |
|---|---|
| 全文搜索 | 精确匹配关键词,类似 Ctrl+F |
| 向量语义搜索 | 问「怎么处理用户登录」能匹配到「鉴权模块」「身份认证流程」 |
搜索范围跨所有笔记本,不用记哪个文件放在哪。
6. 内容转换 + AI 笔记
- Insights 面板:每份资料自动生成 Dense Summary
- Content Transformations:自定义转换规则,比如提取所有 PDF 中的竞品价格信息成表格
- AI 笔记:从上传资料提炼,每条笔记关联来源资料
7. REST API + MCP 集成
REST API(端口 5055):Web 界面能做的,API 全能做——上传资料、建笔记本、发起聊天、生成播客。
# 示例:脚本自动推送 RSS 文章到笔记本,定时出摘要并发通知
MCP 集成(Anthropic 开放协议):
- 接入 Claude Desktop:Claude 能搜你的私有知识库回答问题
- 接入 VS Code:AI 插件实时引用知识库里的技术文档当上下文
这才是拉开差距的地方——不是又一个聊天套壳,而是能嵌进开发工具链的基础设施。
技术栈
| 组件 | 技术 |
|---|---|
| 后端 | Python + FastAPI |
| 前端 | Next.js + React |
| 数据库 | SurrealDB |
| AI 抽象层 | Esperanto(18 家提供商统一封装) |
| TTS | ElevenLabs / OpenAI TTS / Google TTS / Edge-TTS |
| 部署 | Docker Compose |
快速部署
前提
- 安装 Docker Desktop
第一步:拉取配置
curl -o docker-compose.yml https://raw.githubusercontent.com/lfnovo/open-notebook/main/docker-compose.yml
第二步:修改加密密钥
# 把默认值改成你自己的密钥
- OPEN_NOTEBOOK_ENCRYPTION_KEY=change-me-to-a-secret-string
第三步:启动
docker compose up -d
等十几二十秒,浏览器打开 http://localhost:8502 即可使用。
第四步:配置模型
进入 Models 页面 → 选提供商 → 填 API Key → Test → Sync Models → 勾选启用。
零成本方案:装 Ollama → 拉个 Qwen3 或 Llama → 选择 Ollama 当提供商即可。项目提供了 docker-compose-ollama.yml 一键部署。
优缺点
✅ 优点
- 🆓 MIT 协议,完全免费
- 🔒 数据本地,隐私安全
- 🔄 18 家模型任意切换,不被供应商绑死
- 🎙️ 播客 1-4 人,完全自定义
- 🔌 REST API + MCP,可嵌入工具链
- 🐳 Docker 两分钟部署
⚠️ 不足
- 👤 目前只支持单用户,无多人协作
- 📍 引用功能较基础,无原文高亮定位
- 🐌 大文件 Embedding 速度取决于机器配置,纯 CPU 跑几百页 PDF 较慢
总结
Open Notebook 是目前最完整的 Notebook LM 开源替代方案。3.2 万 Star 不是吹出来的——本地隐私 + 18 家模型 + 自定义播客 + MCP 集成,每一项都打在 Notebook LM 的痛点上。
核心价值:
- 🏠 数据主权:不出硬盘
- 🔀 模型自由:不被一家绑死
- 🎙️ 播客工坊:从 2 人固定到 4 人自定义
- 🔌 基础设施:不是聊天套壳,是能嵌进工具链的知识库
如果你对数据隐私有要求、想自由选择模型、或者需要把知识库接入开发工作流,Open Notebook 值得立刻部署试试。
相关链接
- GitHub: https://github.com/lfnovo/open-notebook
- 原文: https://mp.weixin.qq.com/s/ACLLu6zMlnEgXcte7v1JYQ
Keywords: Open Notebook, Notebook LM, AI 知识库, RAG, 播客生成, MCP, Ollama, DeepSeek, 本地部署, 隐私, 开源项目, SurrealDB, FastAPI, Next.js