程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
编程
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
2026-06-16 04:47:57 +0800 CST
view 126
深度实战微软开源神器MarkItDown:从多格式文档解析到LLM友好Markdown转换,涵盖RAG系统构建、MCP集成、批量处理优化、生产级API服务部署,10000字完整指南。
MarkItDown
文档转换
Markdown
RAG
LLM
MCP
AI Agent
Python
OpenCode 深度解析:157K Star 的开源 AI 编程智能体——如何打造 Claude Code 的完美平替
编程
OpenCode 深度解析:157K Star 的开源 AI 编程智能体——如何打造 Claude Code 的完美平替
2026-05-16 05:45:45 +0800 CST
view 344
深度解析OpenCode——157K Star的开源AI编程智能体,支持75+ LLM提供商,如何成为Claude Code的完美平替
AI编程
开源
OpenCode
Claude Code平替
LLM
Headroom 深度实战:当 AI Agent 学会了「精打细算」——从 Token 成本黑洞到上下文压缩的底层原理、从 CCR 可逆存储到六大压缩算法的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 学会了「精打细算」——从 Token 成本黑洞到上下文压缩的底层原理、从 CCR 可逆存储到六大压缩算法的生产级完全指南(2026)
2026-06-21 15:57:54 +0800 CST
view 29
深度解析开源项目 Headroom:AI Agent 的上下文压缩中间层,60-95% Token 节省,CCR 可逆存储,六大压缩算法完全指南。
AI编程
Token压缩
Headroom
上下文管理
LLM推理优化
AI Agent
Andrej Karpathy Skills 深度实战:终结LLM编程的「四大天坑」——从 CLAUDE.md 规范到生产级 AI 辅助编程的完全指南(2026)
编程
Andrej Karpathy Skills 深度实战:终结LLM编程的「四大天坑」——从 CLAUDE.md 规范到生产级 AI 辅助编程的完全指南(2026)
2026-06-10 12:47:30 +0800 CST
view 293
前 Tesla AI 总监 Andrej Karpathy 开源的 CLAUDE.md 配置项目,系统性解决 LLM 编程四大天坑。本文深度解析四大核心原则、架构设计、代码实战,助你从「AI 代码生成器」进化到「AI 工程协作」。
AI编程
LLM
Claude Code
Python
测试驱动开发
DiffusionGemma 深度实战:当文本生成告别逐字蹦字——从离散扩散到 1100 tokens/s 的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当文本生成告别逐字蹦字——从离散扩散到 1100 tokens/s 的生产级完全指南(2026)
2026-06-16 07:18:07 +0800 CST
view 113
Google DeepMind 开源 DiffusionGemma 离散文本扩散模型深度实战:从并行去噪原理到 1100 tokens/s 推理,完整代码示例与 Agent 构建
DiffusionGemma
文本扩散
离散扩散
LLM
开源模型
Google DeepMind
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
编程
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
2026-04-10 00:14:55 +0800 CST
view 1152
深度解析 caveman 开源项目:一个让 Claude Code 用「穴居人语言」说话的 skill,砍掉 75% Token 消耗同时保持 100% 技术准确率。
Claude Code
Token优化
AI编程
Prompt Engineering
LLM效率
开源工具
程序员工具
代码审查
GenericAgent 自进化机制深度剖析:分层记忆架构与 Token 效率优化实战
编程
GenericAgent 自进化机制深度剖析:分层记忆架构与 Token 效率优化实战
2026-04-29 06:12:06 +0800 CST
view 727
深度剖析 GenericAgent 的技术架构:仅 3K 行核心代码实现自我进化的 AI Agent,分层记忆系统实现 6 倍 Token 效率提升,支持浏览器注入、系统级控制、ADB 移动设备操作。
GenericAgent
AI Agent
自我进化
LLM
Karpathy的LLM Wiki:一种将RAG从「解释器模式」升级为「编译器模式」的革命性架构
编程
Karpathy的LLM Wiki:一种将RAG从「解释器模式」升级为「编译器模式」的革命性架构
2026-04-19 09:13:12 +0800 CST
view 1409
深度解析Karpathy提出的LLM Wiki架构,从算法原理、工程实现、代码实战三个维度讲清楚「编译器模式」如何颠覆传统RAG知识库
LLM Wiki
RAG
知识库
AI Agent
Karpathy
自进化知识库
第二大脑
Headroom 深度实战:当 AI Agent 遇见上下文压缩——从 Token 黑洞到 60-95% 暴降的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 遇见上下文压缩——从 Token 黑洞到 60-95% 暴降的生产级完全指南(2026)
2026-06-16 13:16:31 +0800 CST
view 194
Headroom 是一个 GitHub 上 26000+ Star 的开源项目,作为 AI Agent 的上下文压缩中间层,实测节省 60-95% Token,精度保留率 97%。本文从架构设计、六大压缩算法、CCR 可逆压缩、跨 Agent 记忆等维度深度拆解。
AI Agent
Headroom
Token优化
上下文压缩
LLM
开源项目
编程
MarkItDown 深度实战:微软 AutoGen 团队开源的万能文档转 Markdown 引擎——从四层架构到 LLM/RAG 生产级集成的完全指南(2026)
2026-06-02 08:52:38 +0800 CST
view 186
微软AutoGen团队开源的MarkItDown能将PDF、Word、PPT、Excel、图片、音频等20+格式一键转为LLM友好的结构化Markdown。本文从四层架构、源码解析、代码实战、性能优化到生产级部署,彻底拆解这一11.9万星开源项目的核心技术。
MarkItDown
Microsoft
文档转换
Markdown
LLM
RAG
AutoGen
Python
IntelliJ IDEA 2026.1 深度解析:IDE 的战略升维——从代码编辑器到 AI Agent 开放平台
编程
IntelliJ IDEA 2026.1 深度解析:IDE 的战略升维——从代码编辑器到 AI Agent 开放平台
2026-05-09 23:43:15 +0800 CST
view 409
IntelliJ IDEA 2026.1深度解析:ACP协议开放AI Agent平台、Codex/Cursor/Claude多Agent协作、Spring运行时洞察、Java 26首日支持、虚拟线程调试工具链等核心新特性全剖析
IntelliJ IDEA
JetBrains
Java
Kotlin
AI Agent
ACP协议
IDE
编程工具
Spring
虚拟线程
长时程Agent革命:2026年AI从"聊天机器人"到"自主工作者"的终极跨越(上)
编程
长时程Agent革命:2026年AI从"聊天机器人"到"自主工作者"的终极跨越(上)
2026-05-16 14:59:36 +0800 CST
view 286
深度剖析2026年长时程Agent技术革命(上篇):从任务分解、长期记忆、自我反思三大核心能力,到LangGraph代码实战。
AI Agent
长时程任务
LLM
AGI
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
编程
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
2026-05-10 00:41:20 +0800 CST
view 293
Docker 27 Orion深度解析:GPU拓扑感知调度与PCIe/NVLink自动绑定、NUMA内存带宽限制、dockerd-scheduler AI调度代理、docker ai run零配置LLM部署、Dockerfile.ai模型封装语法、OOM Killer五步防御、cgroups v2集成与生产环境避坑指南
Docker
容器化
GPU调度
NUMA
AI推理
LLM
docker-compose
cgroups
Dockerfile
NVIDIA
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
编程
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
2026-06-10 22:16:42 +0800 CST
view 353
Headroom上下文压缩中间层实战:Token节省60-95%,精度保留97%。从原理拆解到LangChain/OpenClaw生产级集成,附完整代码示例。
AI Agent
上下文压缩
Token优化
Headroom
LLM成本
LangChain
RAG
生产级实战
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
编程
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
2026-06-16 16:46:05 +0800 CST
view 201
深度解析 2026 年 Apple Silicon 本地大模型推理技术栈:从 llama.cpp 量化体系到 oMLX 分层 KV 缓存架构,从 MTP 加速到 CoreAI 全栈指南,包含实测 Benchmark 与生产级部署方案。
Apple Silicon
MLX
llama.cpp
oMLX
MTP
本地大模型
量化
本地推理
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
编程
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
2026-06-11 00:19:05 +0800 CST
view 164
全面解析 llama.cpp 推理引擎,从 GGUF 格式、量化原理、架构设计到跨平台部署,提供生产级代码实战和性能优化指南。
llama.cpp
GGUF
量化
端侧推理
大语言模型
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
编程
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
2026-06-16 18:52:52 +0800 CST
view 184
Google DeepMind联合NVIDIA发布DiffusionGemma——基于离散文本扩散的实验性开源模型。本文深入解读26B MoE架构、双向注意力机制、本地推理4倍加速原理,附完整代码示例和部署实战。
Google
DiffusionGemma
扩散模型
MoE
开源LLM
本地推理
AI推理加速
Sage-Wiki 深度解析:当知识管理从「手动整理」变成「LLM自动编译」
编程
Sage-Wiki 深度解析:当知识管理从「手动整理」变成「LLM自动编译」
2026-04-10 06:03:55 +0800 CST
view 925
sage-wiki 是基于 Andrej Karpathy 想法实现的 LLM-compiled 个人知识库,支持15种格式自动编译成互链 Wiki,MCP 接口让 AI Agent 访问你的知识。
sage-wiki
知识管理
LLM
Go
编译器
Karpathy
MCP
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
编程
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
2026-04-19 17:14:36 +0800 CST
view 552
深度解析微软开源工具 MarkItDown,10.8万星GitHub热门项目,解决 LLM 文档处理的世纪难题。支持20+格式一键转Markdown,MCP协议与AI工具深度集成。
MarkItDown
Markdown
Python
微软
LLM
MCP
RAG
文档处理
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
2026-06-11 03:16:24 +0800 CST
view 172
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
obra/superpowers 深度实战:用工程纪律驯服 AI 编程 Agent——从 Prompt 工程到 Process 工程的范式转移
编程
obra/superpowers 深度实战:用工程纪律驯服 AI 编程 Agent——从 Prompt 工程到 Process 工程的范式转移
2026-05-23 05:45:11 +0800 CST
view 291
深度解析 GitHub 20万星开源项目 obra/superpowers,探讨如何用工程纪律(TDD、任务拆解、代码审查)驯服 AI 编程 Agent,从 Prompt 工程到 Process 工程的范式转移。
AI编程
Agent框架
软件工程
LLM
GitHub开源
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
编程
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
2026-06-11 03:17:21 +0800 CST
view 223
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
Onyx 深度解析:当开源AI平台把「企业级能力」变成「一键部署」
编程
Onyx 深度解析:当开源AI平台把「企业级能力」变成「一键部署」
2026-04-10 07:36:00 +0800 CST
view 355
Onyx 是 26k+ stars 的开源AI平台,提供 Agentic RAG、Deep Research、Custom Agents、MCP 等企业级能力。本文深度解析其架构设计、核心功能和部署实战,是私有AI部署的标准答案。
Onyx
开源AI
RAG
企业AI
LLM平台
LLM 驱动的自动化漏洞挖掘:从 AIxVuln 到 Wiz 实战,多 Agent 如何重塑安全攻防体系
编程
LLM 驱动的自动化漏洞挖掘:从 AIxVuln 到 Wiz 实战,多 Agent 如何重塑安全攻防体系
2026-05-23 06:17:17 +0800 CST
view 255
深入解析 LLM 驱动的自动化漏洞挖掘技术,从 AIxVuln 多 Agent 架构到 Wiz 发现 GitHub CVE-2026-3854 的实战案例,覆盖架构设计、代码实战、性能优化与安全边界
AI安全
漏洞挖掘
LLM
多Agent
Docker沙箱
Wiz
GitHub
CVE
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
19
20
21
22
23
...
54
下一页