程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Agent Lightning 深度解析:微软开源 AI Agent 训练框架——零代码改动,让任何 AI Agent 学会「自我进化」
编程
Agent Lightning 深度解析:微软开源 AI Agent 训练框架——零代码改动,让任何 AI Agent 学会「自我进化」
2026-05-16 03:14:41 +0800 CST
view 396
微软研究院开源 Agent Lightning:零代码改动训练任何 AI Agent,支持 RL/APO/SFT,已验证 128 GPU 大规模训练。
AgentLightning
强化学习
AI Agent
微软开源
LLM训练
PydanticAI 深度实战:当 Python 类型系统遇见 AI Agent——从类型安全到生产级智能体工程完全指南(2026)
编程
PydanticAI 深度实战:当 Python 类型系统遇见 AI Agent——从类型安全到生产级智能体工程完全指南(2026)
2026-06-21 13:24:53 +0800 CST
view 144
PydanticAI深度实战:类型安全+依赖注入+评估驱动开发,从零构建生产级AI Agent,含完整代码示例和性能优化策略。
PydanticAI
Python
AI Agent
类型安全
生产级
LLM
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 390
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
编程
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
2026-05-06 17:37:39 +0800 CST
view 557
深度解析 SGLang 推理框架的 RadixAttention 原理、DSL 编程范式、正则约束解码,以及在 Agent 系统和多轮对话场景的生产部署实践。
SGLang
LLM
推理加速
Agent
RadixAttention
结构化生成
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
编程
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
2026-06-15 21:20:49 +0800 CST
view 156
深入解析小米MiMo UltraSpeed如何通过SWA架构在通用GPU上突破1000 tokens/s推理速度,从O(n²)困境到极致跨越的完整技术指南。
SWA
Sliding Window Attention
LLM推理
小米MiMo
推理优化
Transformer
PagedAttention
量化推理
端侧AI
AI Hedge Fund 深度解析:当巴菲特遇上大模型——多智能体投资系统的工程革命
编程
AI Hedge Fund 深度解析:当巴菲特遇上大模型——多智能体投资系统的工程革命
2026-04-14 04:53:29 +0800 CST
view 1651
深度解析 GitHub 51.7k Star 项目 AI Hedge Fund:如何用 15+ AI Agent 复刻巴菲特、芒格等传奇投资人的思维范式,探索多智能体协作在投资决策中的工程实践。
AI Hedge Fund
多智能体系统
投资Agent
巴菲特
GitHub Trending
Python
LLM应用
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 355
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 327
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
编程
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
2026-06-16 04:47:57 +0800 CST
view 200
深度实战微软开源神器MarkItDown:从多格式文档解析到LLM友好Markdown转换,涵盖RAG系统构建、MCP集成、批量处理优化、生产级API服务部署,10000字完整指南。
MarkItDown
文档转换
Markdown
RAG
LLM
MCP
AI Agent
Python
Headroom 深度实战:当 AI Agent 学会了「精打细算」——从 Token 成本黑洞到上下文压缩的底层原理、从 CCR 可逆存储到六大压缩算法的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 学会了「精打细算」——从 Token 成本黑洞到上下文压缩的底层原理、从 CCR 可逆存储到六大压缩算法的生产级完全指南(2026)
2026-06-21 15:57:54 +0800 CST
view 118
深度解析开源项目 Headroom:AI Agent 的上下文压缩中间层,60-95% Token 节省,CCR 可逆存储,六大压缩算法完全指南。
AI编程
Token压缩
Headroom
上下文管理
LLM推理优化
AI Agent
Karpathy的LLM Wiki:一种将RAG从「解释器模式」升级为「编译器模式」的革命性架构
编程
Karpathy的LLM Wiki:一种将RAG从「解释器模式」升级为「编译器模式」的革命性架构
2026-04-19 09:13:12 +0800 CST
view 1486
深度解析Karpathy提出的LLM Wiki架构,从算法原理、工程实现、代码实战三个维度讲清楚「编译器模式」如何颠覆传统RAG知识库
LLM Wiki
RAG
知识库
AI Agent
Karpathy
自进化知识库
第二大脑
Headroom 深度实战:当 AI Agent 遇见上下文压缩——从 Token 黑洞到 60-95% 暴降的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 遇见上下文压缩——从 Token 黑洞到 60-95% 暴降的生产级完全指南(2026)
2026-06-16 13:16:31 +0800 CST
view 285
Headroom 是一个 GitHub 上 26000+ Star 的开源项目,作为 AI Agent 的上下文压缩中间层,实测节省 60-95% Token,精度保留率 97%。本文从架构设计、六大压缩算法、CCR 可逆压缩、跨 Agent 记忆等维度深度拆解。
AI Agent
Headroom
Token优化
上下文压缩
LLM
开源项目
长时程Agent革命:2026年AI从"聊天机器人"到"自主工作者"的终极跨越(上)
编程
长时程Agent革命:2026年AI从"聊天机器人"到"自主工作者"的终极跨越(上)
2026-05-16 14:59:36 +0800 CST
view 335
深度剖析2026年长时程Agent技术革命(上篇):从任务分解、长期记忆、自我反思三大核心能力,到LangGraph代码实战。
AI Agent
长时程任务
LLM
AGI
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
编程
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
2026-06-10 22:16:42 +0800 CST
view 469
Headroom上下文压缩中间层实战:Token节省60-95%,精度保留97%。从原理拆解到LangChain/OpenClaw生产级集成,附完整代码示例。
AI Agent
上下文压缩
Token优化
Headroom
LLM成本
LangChain
RAG
生产级实战
Andrej Karpathy 的 CLAUDE.md 工程规范深度解析:AI 辅助编码的四大原则与生产级实践
编程
Andrej Karpathy 的 CLAUDE.md 工程规范深度解析:AI 辅助编码的四大原则与生产级实践
2026-06-30 00:42:36 +0800 CST
view 36
深度解析 Andrej Karpathy 的 CLAUDE.md 四大原则:先思考后编码、简洁优先、精准修改、目标驱动,附带完整代码实战与生产级落地方案。
Andrej Karpathy
CLAUDE.md
AI辅助编码
提示词工程
LLM
AI Agent
系统提示
Python
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
2026-06-11 03:16:24 +0800 CST
view 231
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
你睡觉,AI 干活:Karpathy 的 AutoResearch 如何让大模型自己学会训练自己
编程
你睡觉,AI 干活:Karpathy 的 AutoResearch 如何让大模型自己学会训练自己
2026-04-19 18:47:36 +0800 CST
view 620
深入解析 Andrej Karpathy 的 AutoResearch 开源项目,揭示其让 AI agent 自主修改训练代码、在真实执行中验证改进的核心机制,探讨对算法工程师职业的影响。
AI研究
机器学习
AutoML
LLM训练
Andrej Karpathy
GitHub开源
自动化调参
Python
研究效率
Agent
obra/superpowers 深度实战:用工程纪律驯服 AI 编程 Agent——从 Prompt 工程到 Process 工程的范式转移
编程
obra/superpowers 深度实战:用工程纪律驯服 AI 编程 Agent——从 Prompt 工程到 Process 工程的范式转移
2026-05-23 05:45:11 +0800 CST
view 349
深度解析 GitHub 20万星开源项目 obra/superpowers,探讨如何用工程纪律(TDD、任务拆解、代码审查)驯服 AI 编程 Agent,从 Prompt 工程到 Process 工程的范式转移。
AI编程
Agent框架
软件工程
LLM
GitHub开源
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
编程
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
2026-06-11 03:17:21 +0800 CST
view 365
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
LLM 驱动的自动化漏洞挖掘:从 AIxVuln 到 Wiz 实战,多 Agent 如何重塑安全攻防体系
编程
LLM 驱动的自动化漏洞挖掘:从 AIxVuln 到 Wiz 实战,多 Agent 如何重塑安全攻防体系
2026-05-23 06:17:17 +0800 CST
view 298
深入解析 LLM 驱动的自动化漏洞挖掘技术,从 AIxVuln 多 Agent 架构到 Wiz 发现 GitHub CVE-2026-3854 的实战案例,覆盖架构设计、代码实战、性能优化与安全边界
AI安全
漏洞挖掘
LLM
多Agent
Docker沙箱
Wiz
GitHub
CVE
Everything Claude Code (ECC) 深度实战:当AI编程助手拥有48位专家团队成员——从182个Skill到Token优化、从MCP集成到生产级部署的完全指南(2026)
编程
Everything Claude Code (ECC) 深度实战:当AI编程助手拥有48位专家团队成员——从182个Skill到Token优化、从MCP集成到生产级部署的完全指南(2026)
2026-06-22 09:25:50 +0800 CST
view 124
Everything Claude Code (ECC) 是2026年GitHub最火的AI编程项目,近20万Star。本文深度解析ECC的六大核心模块、48个专业Agent、182个工作流Skill,以及Token优化、MCP集成、生产级部署等实战内容。
Claude Code
AI编程
ECC
Agent
LLM
编程
MarkItDown 深度实战:当微软用 Python 把「文档地狱」变成 Markdown 乐园——从多格式解析到 RAG 知识库落地的生产级完全指南(2026)
2026-06-16 23:52:04 +0800 CST
view 186
微软开源MarkItDown深度实战:从多格式文档解析到RAG知识库落地的完全指南,涵盖PDF/Word/Excel/PPT转换、LangChain/LlamaIndex集成、性能优化与安全防护
MarkItDown
Python
RAG
文档转换
Markdown
LLM
知识库
微软
AI Agent
LangChain
Hermes Agent 深度实战:Nous Research 开源自进化 AI Agent——从闭环学习到生产级部署的完整指南
编程
Hermes Agent 深度实战:Nous Research 开源自进化 AI Agent——从闭环学习到生产级部署的完整指南
2026-05-23 13:15:28 +0800 CST
view 297
Hermes Agent 是由 Nous Research 开源的自进化 AI Agent 框架,内置学习闭环,能从经验中自动创建技能、持久化记忆、跨会话召回,越用越强。本文深度解析其架构设计、核心实现与生产级部署实践。
AI Agent
自进化
Nous Research
Python
LLM
AI Scientist-v2 深度解析:当 AI 第一次独立完成顶会论文并通过同行评审
编程
AI Scientist-v2 深度解析:当 AI 第一次独立完成顶会论文并通过同行评审
2026-04-11 11:46:16 +0800 CST
view 812
AI Scientist-v2 是 Sakana AI 发布的自动化科研论文生成系统,能端到端完成从想法到顶会论文的全流程。本文从程序员视角深入剖析其技术架构、Agentic Tree Search 机制与代码实现,并探讨其对科研和开发者的真实影响。
AI Agent
科研自动化
LLM
机器学习
Nature
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
...
51
下一页