程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Gemma 4 12B 深度实战:当无编码器统一多模态架构走进本地
编程
Gemma 4 12B 深度实战:当无编码器统一多模态架构走进本地
2026-06-14 17:49:21 +0800 CST
view 94
深入解析 Google Gemma 4 12B 的无编码器统一多模态架构,从技术原理到生产部署的完整指南
Gemma4
Google
多模态
本地部署
AI
LLM
Encoder-Free
Gemma 4 12B 工程实践:Encoder-Free 统一多模态架构从原理到本地部署完全指南(2026)
编程
Gemma 4 12B 工程实践:Encoder-Free 统一多模态架构从原理到本地部署完全指南(2026)
2026-06-14 17:49:38 +0800 CST
view 94
深入解析 Google Gemma 4 12B 的无编码器统一多模态架构,从技术原理到生产部署的完整指南
Gemma4
Google
多模态
本地部署
AI
LLM
Encoder-Free
BitNet 深度实战:微软 32K Star 的 1-bit LLM 推理框架——从三值量化原理到 CPU 原生推理的全链路架构解析
编程
BitNet 深度实战:微软 32K Star 的 1-bit LLM 推理框架——从三值量化原理到 CPU 原生推理的全链路架构解析
2026-05-07 03:35:48 +0800 CST
view 314
深度解析微软 BitNet 1-bit LLM 推理框架,从三值量化数学原理到 bitnet.cpp 内核优化,再到 CPU 原生推理实战部署的全链路架构解析
BitNet
1-bit LLM
量化
CPU推理
微软
编程
Headroom 深度实战:当 AI Agent 学会「上下文压缩」——从 Token 暴降 95% 原理到生产级实践的完全指南(2026)
2026-06-08 17:53:16 +0800 CST
view 209
Headroom 是一个专为 AI Agent 设计的开源上下文压缩中间层,实测节省 60-95% Token,精度保留率高达 97%。本文从架构原理、六大压缩算法、MCP集成到生产级部署全面深度解析。涵盖 ContentRouter、SmartCrusher、可逆缓存等核心技术,配完整 Python 代码示例。适合 Claude Code、Cursor、LangChain 等工具链用户。Apache 2.0 开源可商用。
AI Agent,Token优化,上下文压缩,Headroom,LLM,Python,上下文管理,AI编程,生产实践
Headroom深度实战:当AI Agent学会「上下文减肥」——从60-95% Token压缩到零精度损失的工程完全指南(2026)
编程
Headroom深度实战:当AI Agent学会「上下文减肥」——从60-95% Token压缩到零精度损失的工程完全指南(2026)
2026-06-14 19:18:14 +0800 CST
view 76
全面拆解Headroom上下文压缩工具的原理、架构、接入方式与生产实践,解决AI Agent开发的Token成本与上下文窗口痛点
AI Agent
上下文压缩
Headroom
Token优化
LLM
Bun SIMD 深度实战:当 JavaScript 运行时拥抱 CPU 向量指令——从 Buffer.indexOf 2倍提速到 CRC32 20倍飞跃的生产级完全指南(2026)
编程
Bun SIMD 深度实战:当 JavaScript 运行时拥抱 CPU 向量指令——从 Buffer.indexOf 2倍提速到 CRC32 20倍飞跃的生产级完全指南(2026)
2026-06-08 18:28:13 +0800 CST
view 157
Bun 2026 SIMD深度实战:从Buffer.indexOf 2倍提速到CRC32 20倍飞跃,Mimalloc v3多线程内存分配,FastStringifier JSON加速,生产级迁移指南
Bun
SIMD
JavaScript
性能优化
AVX2
CRC32
Mimalloc
Headroom深度实战:AI Agent上下文压缩完全指南——60-95% Token节省的零精度损失方案(2026)
编程
Headroom深度实战:AI Agent上下文压缩完全指南——60-95% Token节省的零精度损失方案(2026)
2026-06-14 19:19:54 +0800 CST
view 64
全面拆解Headroom上下文压缩工具的原理、架构、接入方式与生产实践,解决AI Agent开发的Token成本与上下文窗口痛点
AI Agent
上下文压缩
Headroom
Token优化
LLM
Docs2KG:用大模型把PDF、邮件、Excel统一建成知识图谱,让企业沉睡知识激活
编程
Docs2KG:用大模型把PDF、邮件、Excel统一建成知识图谱,让企业沉睡知识激活
2026-04-16 19:04:26 +0800 CST
view 477
Docs2KG是AI4WA开源的知识图谱构建框架,用大模型将PDF、邮件、Excel等异构文档统一抽取为知识三元组,构建统一知识图谱,支持问答和推理分析。
知识图谱
AI
LLM
PDF
RAG
知识管理
开源
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
编程
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
2026-06-08 20:52:38 +0800 CST
view 105
2026年3月Google Research在ICLR 2026发表TurboQuant算法,将LLM的KV缓存压缩至3-bit,实现6倍内存缩减和8倍推理加速。本文深入剖析TurboQuant的技术原理,并提供生产级部署指南。
TurboQuant
KV缓存压缩
LLM推理优化
量化算法
Google Research
ICLR2026
FastGPT:27.2K Star零代码构建企业级AI知识库,可视化工作流+多模态文档一站搞定
编程
FastGPT:27.2K Star零代码构建企业级AI知识库,可视化工作流+多模态文档一站搞定
2026-04-16 19:06:53 +0800 CST
view 577
FastGPT是环界云团队开源的AI知识库问答系统(27.2K Stars),零代码构建私有知识库,支持可视化工作流编排和多模态文档解析,支持GPT/Claude等任意LLM模型。
AI
知识库
FastGPT
RAG
开源
LLM
工作流
Dify
Dify:92K Star开源LLM应用平台,零代码构建生产级AI工作流,Docker一键部署
编程
Dify:92K Star开源LLM应用平台,零代码构建生产级AI工作流,Docker一键部署
2026-04-16 19:09:32 +0800 CST
view 550
Dify是开源的LLM应用开发平台(92K Stars),零代码构建生产级AI应用,支持可视化工作流编排和知识库管理,服务超过2000个团队,已完成3000万美元融资。
AI
LLM
Dify
工作流
RAG
开源
知识库
可视化编排
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
编程
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
2026-04-16 19:11:21 +0800 CST
view 401
LangChain4j是Java世界的LangChain,简化Java应用集成大语言模型,支持OpenAI/Claude/DeepSeek等模型,提供RAG、Agent、Tool Calling、Memory等完整能力,Apache 2.0协议。
Java
LangChain
AI
LLM
RAG
Agent
开源
工具调用
Headroom 深度解析:如何让 LLM Token 消耗减少 60-95% 而质量不降——2026 年 AI Agent 上下文压缩完全指南
编程
Headroom 深度解析:如何让 LLM Token 消耗减少 60-95% 而质量不降——2026 年 AI Agent 上下文压缩完全指南
2026-06-15 01:49:57 +0800 CST
view 50
深度解析 GitHub Trending 2026 榜首项目 Headroom,详解如何让 LLM Token 消耗减少 60-95% 而回答质量不降,含完整代码示例与生产成本优化方案。
LLM
Token压缩
AI Agent
上下文工程
Headroom
Python
Rust
成本优化
CLAUDE.md 完全指南(上):当 AI 学会「工程师纪律」——Karpathy 四大原则深度解析(2026)
编程
CLAUDE.md 完全指南(上):当 AI 学会「工程师纪律」——Karpathy 四大原则深度解析(2026)
2026-06-15 02:19:02 +0800 CST
view 54
2026年GitHub Trending榜首项目(149K+ Stars)深度解析(上篇):深入剖析Karpathy观察到的LLM编程四大陷阱,以及CLAUDE.md四大原则的工程哲学。
AI编程
Claude Code
LLM
工程实践
提示词工程
CLAUDE.md 完全指南(下):代码实战、定制技巧与团队协作规范(2026)
编程
CLAUDE.md 完全指南(下):代码实战、定制技巧与团队协作规范(2026)
2026-06-15 02:19:50 +0800 CST
view 55
《CLAUDE.md 完全指南》下篇:提供完整的Todo API实战案例、定制技巧、多工具适配方案(Claude Code/Cursor/Copilot)、性能实测数据、团队协作规范。
AI编程
Claude Code
LLM
工程实践
提示词工程
编程
MarkItDown 深度解析:微软 AutoGen 团队出品的万能文档转换工具,如何让 RAG 系统真正「吃得好」
2026-04-17 09:15:57 +0800 CST
view 486
微软 AutoGen 团队出品的 MarkItDown 如何解决 RAG 系统中文档预处理的格式地狱,深度解析其架构设计、各格式处理策略与 RAG 实战集成。
Python
Tools
RAG
LLM
AutoGen
MarkItDown 深度实战:当文档转换学会了「LLM 优先」——从 15 万 Star 爆款到 RAG 预处理生产级全链路完全指南(2026)
编程
MarkItDown 深度实战:当文档转换学会了「LLM 优先」——从 15 万 Star 爆款到 RAG 预处理生产级全链路完全指南(2026)
2026-06-15 06:19:28 +0800 CST
view 53
微软 MarkItDown 15万Star深度实战:从架构解析、全格式转换、RAG预处理流水线、插件开发到生产部署的完全指南
MarkItDown
RAG
文档转换
LLM
Python
ADK-Rust 深度实战:当 AI Agent 学会「零成本抽象」——从 Trait 驱动架构到图工作流引擎的生产级完全指南(2026)
编程
ADK-Rust 深度实战:当 AI Agent 学会「零成本抽象」——从 Trait 驱动架构到图工作流引擎的生产级完全指南(2026)
2026-06-15 06:49:02 +0800 CST
view 62
ADK-Rust 生产级框架深度实战:从五大核心 Trait 架构到 GraphAgent 图工作流引擎,从 #[tool] 宏零样板工具定义到 MCP 集成,从 Session 加密到 RBAC 安全体系,从模型路由到评估流水线——完整覆盖 Rust 写 AI Agent 的生产级全链路
Rust
AI Agent
ADK-Rust
图工作流
LLM
X-CMD:给 AI Agent 装上 Shell 超能力,一句话控制你电脑上的软件
编程
X-CMD:给 AI Agent 装上 Shell 超能力,一句话控制你电脑上的软件
2026-04-17 12:55:21 +0800 CST
view 322
介绍 GitHub 开源项目 X-CMD,为 AI Agent 提供 1000+ 轻量命令行工具,一句话控制电脑软件,支持 OpenClaw/Claude Code/Gemini CLI 等。
开源
X-CMD
AI Agent
Shell
命令行工具
GitHub
自动化
Lark AgentX:逆向飞书协议 + MCP函数调用,免申请Bot直接跑AI Agent
编程
Lark AgentX:逆向飞书协议 + MCP函数调用,免申请Bot直接跑AI Agent
2026-06-15 07:46:19 +0800 CST
view 50
Lark AgentX开源项目:用飞书账号做AI Agent,逆向WebSocket+Protobuf协议实时收消息,MCP函数调用框架自动选择tool,Docker Compose一键部署,免申请Bot零配置开箱即用。
Lark AgentX
飞书
MCP
AI Agent
逆向协议
Function Call
开源
Python
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
编程
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
2026-04-08 12:29:41 +0800 CST
view 449
IBM、红帽、谷歌联合向CNCF捐赠llm-d项目,标志着Kubernetes正式迈入AI原生时代。本文深度解析llm-d架构设计、性能数据及实践建议。
Kubernetes
云原生
AI
大模型
llm-d
CNCF
Vite 6 与 Rolldown 深度实战:Rust 重写的前端构建革命——从 Rolldown 引擎到毫秒级 HMR 完全指南(2026)
编程
Vite 6 与 Rolldown 深度实战:Rust 重写的前端构建革命——从 Rolldown 引擎到毫秒级 HMR 完全指南(2026)
2026-05-30 14:40:03 +0800 CST
view 157
Vite 6 用 Rust 重写的 Rolldown 替代 esbuild+Rollup 双引擎,构建速度提升4倍,HMR压至10ms内,内存降低60%,彻底解决dev与build不一致问题。
Vite
Rolldown
Rust
前端构建
性能优化
Headroom 深度实战:当 AI Agent 学会「省着吃」——从 Token 暴降 60-95% 到可逆上下文压缩的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 学会「省着吃」——从 Token 暴降 60-95% 到可逆上下文压缩的生产级完全指南(2026)
2026-06-09 14:16:12 +0800 CST
view 100
Headroom 是一个开源的 AI Agent 上下文压缩中间层,通过六大专用算法实现 60-95% 的 Token 节省,CCR 可逆存储确保信息零丢失,跨 Agent 记忆打破协作孤岛。
AI Agent
Headroom
上下文压缩
Token优化
LLM
开源项目
AI Agent 修 Bug 的隐秘成本:斯坦福研究揭示编码任务中 Token 消耗的惊人真相
编程
AI Agent 修 Bug 的隐秘成本:斯坦福研究揭示编码任务中 Token 消耗的惊人真相
2026-05-08 11:38:56 +0800 CST
view 405
斯坦福、MIT、密歇根大学联合研究揭示:AI Agent 修复 Bug 的 Token 消耗是普通代码问答的 1000 倍。本文深入剖析 Token 消耗的根因、模型间效率差异,以及从工程层面优化 AI 编程助手成本的方法。
AI Agent
Token成本
LLM
斯坦福研究
工程实践
成本优化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
30
31
32
33
下一页