程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
编程
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
2026-05-18 08:22:35 +0800 CST
view 456
全面解析 vLLM 推理引擎的核心架构,从 PagedAttention 原理到生产级部署实战,涵盖量化推理、多GPU并行、性能调优等完整技术栈
vLLM
LLM推理
PagedAttention
GPU优化
量化推理
深度解析
Headroom 深度实战:当 AI Agent 学会「压缩上下文」——从 Token 暴降 95% 到生产级接入的完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 学会「压缩上下文」——从 Token 暴降 95% 到生产级接入的完全指南(2026)
2026-06-13 14:16:43 +0800 CST
view 293
Headroom 是一个开源的上下文压缩中间层,能在不损失回答质量的前提下把发给 LLM 的上下文压缩掉 60%–95%。本文从架构原理到生产级接入,全面解析这款 GitHub 破万 Star 的 AI 工程利器。
AI Agent
LLM
Token优化
上下文压缩
Python
开源项目
Hermes Agent 深度解析:NousResearch 如何用自我进化机制重新定义 AI 代理的成长范式
编程
Hermes Agent 深度解析:NousResearch 如何用自我进化机制重新定义 AI 代理的成长范式
2026-05-05 03:36:29 +0800 CST
view 440
深度解析NousResearch开源的Hermes Agent自我进化AI代理框架,涵盖架构设计、代码实战、性能优化与未来展望
AI Agent
自我进化
开源项目
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 774
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
微软Build 2026全解析:自研MAI模型矩阵、Scout Agent与Agent优先战略大转身
编程
微软Build 2026全解析:自研MAI模型矩阵、Scout Agent与Agent优先战略大转身
2026-06-05 03:13:37 +0800 CST
view 464
深度解析微软Build 2026开发者大会:7款自研MAI模型矩阵、Scout Agent、Project Solara与Windows Agent优先战略,从开发者视角分析微软分手OpenAI的战略意图。
Microsoft,Build2026,MAI,AI模型,Scout,Agent,GitHubCopilot,VSCode
Lightpanda 深度解析:用 Zig 从零打造 AI 时代的无头浏览器——9 倍内存优化与 140 并发实例的架构内幕
编程
Lightpanda 深度解析:用 Zig 从零打造 AI 时代的无头浏览器——9 倍内存优化与 140 并发实例的架构内幕
2026-05-18 11:17:02 +0800 CST
view 265
Lightpanda是用Zig从零构建的AI专用无头浏览器,9倍内存优化、140并发实例、CDP兼容Puppeteer/Playwright,深度解析架构设计与实战部署
Lightpanda
Zig
无头浏览器
AI Agent
Web自动化
InsForge 深度实战:面向AI编码代理的后端开发平台——2026年完全指南
编程
InsForge 深度实战:面向AI编码代理的后端开发平台——2026年完全指南
2026-05-25 03:34:05 +0800 CST
view 233
本文深入讲解InsForge的核心概念、架构设计、实战安装与插件开发,以及性能优化方法,帮助开发者全面掌握这一2026年热门的AI编码代理后端开发平台。
InsForge
AI编码代理
后端开发平台
开源项目
2026
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 367
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
WebGen-R1 深度实战:7B 小模型如何用强化学习独立建站,碾压 DeepSeek-R1
编程
WebGen-R1 深度实战:7B 小模型如何用强化学习独立建站,碾压 DeepSeek-R1
2026-05-05 11:33:45 +0800 CST
view 369
香港科技大学与阿里巴巴联合研究 WebGen-R1,用强化学习训练 7B 小模型独立生成完整网站,功能成功率超越 DeepSeek-R1,美学评分吊打 GPT-5。
AI
强化学习
代码生成
WebGen-R1
深度学习
MemPalace 深度实战:37K Star 的 AI 记忆宫殿如何用 2000 年古老智慧重新定义 Agent 持久化记忆
编程
MemPalace 深度实战:37K Star 的 AI 记忆宫殿如何用 2000 年古老智慧重新定义 Agent 持久化记忆
2026-05-05 13:34:51 +0800 CST
view 386
深度解析 37K Star 的 MemPalace 记忆宫殿项目:如何用 2000 年前的 Method of Loci 智慧,通过 Wing/Room/Drawer 三层架构和 MCP 协议,为 AI Agent 提供持久化记忆能力
AI Agent
记忆系统
MemPalace
MCP
开源项目
Temporal Replay 2026 深度实战:当持久执行成为 AI Agent 可靠性的行业共识
编程
Temporal Replay 2026 深度实战:当持久执行成为 AI Agent 可靠性的行业共识
2026-06-18 20:25:10 +0800 CST
view 94
深度解析 Temporal Replay 2026 大会发布的 Serverless Workers、Standalone Activities、Workflow Streams 等新特性,以及与 Google ADK、OpenAI Agents SDK 的深度集成如何重新定义 AI Agent 可靠性标准。
Temporal
持久执行
AI Agent
分布式系统
工作流
Workflow
Go
Python
Browser-Use 深度解析:当AI学会看网页——79k Stars背后的浏览器自动化革命
编程
Browser-Use 深度解析:当AI学会看网页——79k Stars背后的浏览器自动化革命
2026-04-14 06:26:31 +0800 CST
view 906
Browser-Use是GitHub 79k+ Stars的AI浏览器自动化框架,通过LLM驱动实现自然语言控制浏览器。本文深度解析其架构设计、双模态页面理解、多模型集成机制,并附完整代码实战示例。
Browser-Use
浏览器自动化
AI Agent
Playwright
LLM驱动
Karpathy AutoResearch 深度解析:630行代码如何让AI学会「自己做研究」
编程
Karpathy AutoResearch 深度解析:630行代码如何让AI学会「自己做研究」
2026-04-23 10:51:04 +0800 CST
view 569
深入解析Andrej Karpathy的开源项目AutoResearch,630行Python代码如何实现AI自主研究,探讨约束驱动的设计哲学与工程实践
Python
机器学习
AI Agent
深度学习
自动优化
从 MCP 到 A2A:2026 年 AI Agent 协议时代——标准化通信层如何重塑智能体协作范式
编程
从 MCP 到 A2A:2026 年 AI Agent 协议时代——标准化通信层如何重塑智能体协作范式
2026-05-05 14:37:35 +0800 CST
view 494
深度解析 MCP 与 A2A 两大协议的设计哲学、技术架构与工程实践,从 Function Calling 的局限性到协议层的标准化演进,含完整 MCP Server 实战代码
MCP
A2A
AI Agent
协议
Anthropic
GitHub Copilot 暂停新用户注册背后:AI Agent 算力危机与编程范式重构
编程
GitHub Copilot 暂停新用户注册背后:AI Agent 算力危机与编程范式重构
2026-04-23 13:42:10 +0800 CST
view 536
深度分析 GitHub Copilot 暂停新用户注册背后的算力危机:AI Agent 如何重塑计算经济学、定价模型的结构性缺陷、技术优化路径与商业模式重构方向。
AI
Copilot
GitHub
Agent
算力
MCP深度解析:Anthropic推出的AI工具集成标准协议——从原理到生产级实战的完整技术内幕
编程
MCP深度解析:Anthropic推出的AI工具集成标准协议——从原理到生产级实战的完整技术内幕
2026-05-18 13:24:04 +0800 CST
view 299
深度解析MCP协议:从JSON-RPC通信机制到Python/TypeScript实战,覆盖架构原理、Transport层、安全机制、生产级部署的完整技术内幕
MCP
AI Agent
Model Context Protocol
Anthropic
AI工具集成
Browser-use 深度实战:当 AI Agent 真正拥有浏览器——从自然语言任务到网页自动化、从 Stealth 架构到生产级编排(2026)
编程
Browser-use 深度实战:当 AI Agent 真正拥有浏览器——从自然语言任务到网页自动化、从 Stealth 架构到生产级编排(2026)
2026-06-18 23:03:00 +0800 CST
view 81
2026年最火的 browser-use 项目深度实战:从 Cloud SDK 到本地开源版,从结构化输出到生产级安全边界,附可直接运行的代码与性能优化建议。
Browser Use
AI Agent
Web Automation
Browser Automation
LLM Tools
Claude写代码错误率从41%降到3%:Karpathy的12条CLAUDE.md规则实战全解
编程
Claude写代码错误率从41%降到3%:Karpathy的12条CLAUDE.md规则实战全解
2026-06-13 21:46:46 +0800 CST
view 221
从Karpathy原始4条规则到扩展12条规则的完整实战指南,覆盖token预算、测试质量、多步骤工作流等原始规则未触达的核心场景
AI编程
Claude Code
Karpathy
CLAUDE.md
Agent工程化
Prompt工程
CUA 深度实战:当 AI Agent 真正掌控桌面操作系统——从沙盒隔离到 Computer-Use Agents 的生产级基础设施完全指南(2026)
编程
CUA 深度实战:当 AI Agent 真正掌控桌面操作系统——从沙盒隔离到 Computer-Use Agents 的生产级基础设施完全指南(2026)
2026-06-18 23:28:31 +0800 CST
view 112
深入解析 trycua/cua 开源项目:Computer-Use Agents 领域的生产级基础设施,包含五大核心模块的架构剖析、代码实战与安全架构设计
AI Agent
Computer Use
CUA
开源
沙盒
LLM
Superpowers 深度解析:让 AI 编程助手拥有「超能力」的工程化工作流框架——从 TDD 强制执跑到生产级代码交付的完整技术内幕
编程
Superpowers 深度解析:让 AI 编程助手拥有「超能力」的工程化工作流框架——从 TDD 强制执跑到生产级代码交付的完整技术内幕
2026-05-18 14:18:05 +0800 CST
view 460
深度解析 GitHub 78,000+ Star 的 AI 编程工程化框架 Superpowers,揭秘其如何通过结构化技能系统将 AI 编码助手从「代码生成器」进化为「软件工程师伙伴」
AI编程
AI Agent
TDD
工程化
Superpowers
trycua/cua 深度实战:YC支持的 Computer-Use Agents 开源基础设施完全指南——五大模块架构解析、沙盒操控与生产级代码实战(2026)
编程
trycua/cua 深度实战:YC支持的 Computer-Use Agents 开源基础设施完全指南——五大模块架构解析、沙盒操控与生产级代码实战(2026)
2026-06-18 23:29:38 +0800 CST
view 138
深入解析 trycua/cua 开源项目:Computer-Use Agents 领域的生产级基础设施,包含五大核心模块的架构剖析、代码实战与安全架构设计
AI Agent
Computer Use
CUA
开源
沙盒
LLM
Superpowers 深度解析:当AI编码智能体学会"测试驱动开发"——从提示词工程到工程化工作流的范式革命
编程
Superpowers 深度解析:当AI编码智能体学会"测试驱动开发"——从提示词工程到工程化工作流的范式革命
2026-04-14 13:57:16 +0800 CST
view 769
Superpowers是GitHub 11万+星的开源项目,通过强制性TDD工作流让AI编码助手从"会写代码"进化到"会做工程"。本文深度解析其技能系统、子代理驱动开发和工程化实践。
AI
Agent
TDD
Superpowers
Claude Code
Cursor
测试驱动开发
工程化
TencentDB Agent Memory 深度解析:让 AI Agent 拥有真正「记忆」的分层架构革命——从61.38% Token节省到四层金字塔的技术内幕
编程
TencentDB Agent Memory 深度解析:让 AI Agent 拥有真正「记忆」的分层架构革命——从61.38% Token节省到四层金字塔的技术内幕
2026-05-18 15:13:25 +0800 CST
view 255
腾讯云开源TencentDB Agent Memory,用四层金字塔架构解决AI Agent健忘问题。实测最高节省61.38% Token,任务通过率提升51.52%。
AI Agent
记忆系统
腾讯云
开源项目
架构设计
MiMo Code 深度实战:当小米用 1 万亿参数杀入 AI 编程 Agent 赛道——从持久记忆到 Max Mode、从四层记忆体系到动态工作流的生产级完全指南(2026)
编程
MiMo Code 深度实战:当小米用 1 万亿参数杀入 AI 编程 Agent 赛道——从持久记忆到 Max Mode、从四层记忆体系到动态工作流的生产级完全指南(2026)
2026-06-19 01:25:01 +0800 CST
view 152
2026年6月小米正式开源MiMo Code V0.1.0,一款面向终端的AI编程助手。本文深度解析其架构设计:计算层Max Mode多采样机制、记忆层四层持久记忆体系、进化层Dream/Distill模式,以及与Claude Code的深度对比评测。
AI编程
MiMo Code
小米
Agent
长程任务
编程助手
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
67
68
69
70
71
...
74
下一页