编程 OctaFuse Gateway:统一管理Coding Plan/Token Plan的开源AI网关,个人SaaS都能用

2026-06-22 21:00:01 +0800 CST views 8

OctaFuse Gateway:统一管理 Coding Plan/Token Plan 的开源 AI 网关,个人 SaaS 都能用

标签: OctaFuse / AI 网关 / 开源 / LLM 管理 / 多模型路由 / SaaS / 计费审计 / Provider Key 池
原文: 微信公众号「TJ君」https://mp.weixin.qq.com/s/kA-n6V3DDX4AuRMuXt4fug
GitHub: https://github.com/OctaFuse/octafuse-gateway
官网: https://octafuse.dev


一句话定位

OctaFuse Gateway 是一个开源 AI 网关,把一堆 Provider、模型路由、API Key、用户、预算、用量审计、财务记账和管理后台放在一起。个人用可以把 Coding Plan/Token Plan 统一成一套入口;做 SaaS 可以把它变成产品里的 LLM 服务底座。


痛点:模型越多,入口越散

典型场景:

  • 一堆 base URL
  • 一堆 API Key
  • 一堆模型名
  • 一堆套餐额度
  • 一堆客户端配置

Cursor 要配一次,脚本要配一次,内部工具也要配一次。某个 Key 快用完了,得去对应平台查;想切换模型,还要重新改 base URL、API Key 和模型名。

真正麻烦的不是没有模型可用,而是入口太散。


OctaFuse Gateway 是什么

采用 Proxy + Admin + Core 结构:

模块作用
Proxy对外提供 OpenAI / Anthropic / Gemini 兼容推理入口
Admin管理后台 + /api/admin/* 自动化管理接口
Core共享类型、数据库迁移、存储层和跨数据库实现

两种部署方式

部署方式适合场景
Cloudflare Worker + Pages + D1低运维,边缘部署
Docker / Node + Postgres 或 MySQL自托管,已有服务器和数据库

核心能力

1. 多协议入口

不只服务 OpenAI-compatible 客户端:

接口对应协议
/v1/chat/completionsOpenAI 兼容
/v1/messagesAnthropic 兼容
/v1beta/*Gemini 兼容

2. 路由:把「模型选择」从客户端里拿出来

fast-coder 做成一条 route,客户端只认这个 route,背后具体走哪个 Provider、哪个上游模型、哪个 API Key,由 Gateway 决定。

后续可以在 Gateway 里:

  • 给不同场景配置不同 route
  • 把便宜模型用于普通任务
  • 把强模型留给复杂任务
  • 按 route group 区分免费/默认/付费/内部使用
  • 上游不可用时做 failover
  • Provider 价格或质量变化时,调整路由而不是改业务

3. Provider Key 池(v1.4.0 关键能力)

给同一个 Provider 配多条上游 Key,设置:

  • label:标记用途
  • status:启用/禁用
  • weight:加权随机
  • priority:优先级

Proxy 层按 priority 分批 failover,同一批里按 weighted-random 选择;近期失败的 Key 进入内存 cooldown,默认 60 秒内跳过。

4. 用户、Key、审计、记账:SaaS 最需要的四件事

需求OctaFuse 方案
用户管理区分不同用户/团队/租户,谁创建 Key、谁在调用、谁消耗额度都能对上
Key 管理给租户/服务端模块发 Gateway Key,不直接暴露上游 Provider Key
审计追踪:哪位用户、哪个 Key、哪个 route、哪个 Provider、什么时间、调用了什么模型、结果是否成功
财务记账三层成本口径:metered_cost(实际计量成本)、standard_cost(标准目录成本)、charged_cost(对用户收取的成本)

5. Admin 后台

自带 Admin 应用,目前已有:

  • Provider 管理
  • Model 管理
  • Route 管理
  • 用户和 API Key 管理
  • 请求日志
  • 用量分析
  • 可靠性摘要
  • Playground(测试路由连通性)
  • Simulator(模拟 OpenAI/Anthropic/Gemini 调用,检查鉴权、路由、计费和日志)
  • 飞书/企业微信错误告警配置

个人场景:一套 base URL 和 API Key 管全部

使用前

Cursor 配一次 Key → 脚本配一次 Key → 内部工具配一次 Key
某个 Key 快用完 → 去对应平台查 → 想换模型 → 重新改配置

使用后

统一 Base URL → OctaFuse Gateway
统一 API Key  → OctaFuse 里的用户 Key
模型名        → Gateway 里的 route

客户端侧保持简单,后续切换 Provider 只需在 Gateway 后台改路由,不用到处改客户端配置。


SaaS 场景:把 LLM 接入做成基础设施

没有网关时,业务系统要自己处理:

问题业务系统自己做会怎样
Gateway Key自己设计创建、吊销、权限和归属
用量统计自己记录 token、模型、成本、用户
预算限制自己做额度、周期重置和超额拦截
审计追踪自己查每次调用是谁发起、走了哪里
财务记账自己区分成本价、目录价、用户收费价
模型切换自己改配置、迁移、灰度
上游故障自己做 fallback、告警和排查

有 OctaFuse Gateway 后

SaaS 业务系统
  负责用户体验、业务权限、业务数据、AI 功能流程

OctaFuse Gateway
  负责模型 Provider、route、用户 Key、用量、审计、计费口径

上游模型 / Coding Plan / Token Plan
  负责真正的模型推理能力

业务系统不需要直接感知所有模型供应商,只需通过 Admin API 把用户、租户、Key、套餐、额度等信息和 Gateway 对齐。


成本三层口径

成本口径含义
metered_cost实际计量成本(上游采购成本)
standard_cost标准目录成本(产品展示给用户的价格)
charged_cost对用户或业务侧收取的成本(最终收费)

这三件事可能不是同一个数字——可以把「上游采购成本」和「产品商业定价」分开处理。


快速上手

Docker quickstart

docker compose -f docker/compose/quickstart.yml up --build
curl -sS http://localhost:8787/health

健康后默认地址:

服务地址
Proxyhttp://localhost:8787
Adminhttp://localhost:8789

Admin 默认登录:admin / changeme生产环境必须修改

调用示例

curl -sS http://localhost:8787/v1/chat/completions \
  -H "Authorization: Bearer sk-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"your-route-model","messages":[{"role":"user","content":"Hello"}]}'

Cloudflare 本地 D1

npm install
npm run db:migrate
npm run dev:proxy
# 另开终端
npm run dev:admin

Proxy 默认在 127.0.0.1:8787,Admin 默认在 127.0.0.1:8789


注意事项

  1. 它是基础设施,不是免配置工具 — 需要理解 Provider、Model、Route、Key、预算、数据库迁移等概念
  2. 默认账号和密钥一定要改admin/changemeMASTER_KEY 在任何共享环境和生产环境都必须轮换
  3. 适合多模型/多 Key/多客户端场景 — 只调用一个模型的小脚本可能没必要部署网关

适合谁

场景为什么适合
买了多套 Coding Plan/Token Plan 的个人用户统一 base URL、Key、route 和用量入口
经常切换模型的开发者在 Gateway 里调整 route,减少客户端重复配置
内部 AI 平台统一管理 Provider、Key、预算、审计和告警
正在做 AI SaaS 的团队把 LLM 接入、计费、审计从业务系统里拆出来
多租户产品用户、Key、预算和调用日志天然需要集中管理
只调用一个模型的小脚本可能没必要,部署网关会显得重

总结

过去看 AI 网关更多关注支持多少模型、能不能 OpenAI-compatible。但现在真正重要的是:

LLM 能力越来越像一项基础设施,而不是某个业务函数里的几行 HTTP 请求。

  • 🔌 多协议入口:OpenAI / Anthropic / Gemini 兼容
  • 🛤️ 路由抽离:模型选择从客户端配置里抽出来,Gateway 统一调度
  • 🔑 Provider Key 池:多套 Coding Plan/Token Plan 统一调度,failover + 加权随机
  • 📊 三层成本口径:metered_cost / standard_cost / charged_cost
  • 🖥️ Admin 后台:Playground + Simulator + 飞书/企微告警
  • 🏗️ SaaS 分工:业务系统专注产品,LLM 接入/路由/计费/审计交给 Gateway

如果你已经开始被各种模型套餐、API Key、客户端配置和用量账单折磨,这个项目值得试一下。


相关链接


Keywords: OctaFuse, AI 网关, 开源, LLM 管理, 多模型路由, SaaS, 计费审计, Provider Key 池, OpenAI 兼容, Anthropic 兼容, Gemini 兼容, Cloudflare Worker, Docker

推荐文章

Claude:审美炸裂的网页生成工具
2024-11-19 09:38:41 +0800 CST
mysql 优化指南
2024-11-18 21:01:24 +0800 CST
Nginx 防盗链配置
2024-11-19 07:52:58 +0800 CST
Linux 网站访问日志分析脚本
2024-11-18 19:58:45 +0800 CST
Go语言中的`Ring`循环链表结构
2024-11-19 00:00:46 +0800 CST
程序员茄子在线接单