程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 258
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
browser-harness:狂揽 11.9K Stars!让 AI Agent 真正丝滑操控浏览器
案例
browser-harness:狂揽 11.9K Stars!让 AI Agent 真正丝滑操控浏览器
2026-05-11 10:18:42 +0800 CST
view 291
11.9K Stars 的开源项目 browser-harness,通过 CDP 框架直接连接 AI Agent 与真实 Chrome 浏览器,完全模拟人的行为,让 Agent 可以丝滑地浏览网页、搜索资料、填写表单、发布内容,不会触发任何反爬虫检测。
browser-harness
AI Agent
CDP
浏览器自动化
Claude Code
WebSocket
反爬虫
Warp 开源:从终端到 ADE,OpenAI 赞助的代理式开发环境重新定义编码
案例
Warp 开源:从终端到 ADE,OpenAI 赞助的代理式开发环境重新定义编码
2026-05-01 19:48:45 +0800 CST
view 627
Warp 终端开源,15小时 Star 飙升 3.5 万到 43.4K,OpenAI 成为创始赞助商。定位升级为 ADE(代理式开发环境),支持多 Agent 协作。
Warp
ADE
OpenAI
AI终端
Agent
Rust
Grok Build 深度解析:马斯克入局 AI 编程赛道,SpaceXAI 桌面应用正式曝光
编程
Grok Build 深度解析:马斯克入局 AI 编程赛道,SpaceXAI 桌面应用正式曝光
2026-05-11 11:06:04 +0800 CST
view 754
SpaceXAI发布Grok Build桌面编程应用,对标Claude Code与Codex。全面支持MCP、插件、Skills、Git和本地文件管理,主打智能体自主编程工作流。搭载Grok 4.3 Early Access,macOS/Linux/Windows全平台。
AI编程
Grok Build
SpaceXAI
Musk
Claude Code
Codex
Agent
桌面应用
MCP
Cursor Composer 2 深度解析:当 Kimi K2.5 成为硅谷 AI 编程的最强底座——2026 年编程 Agent 架构全解
编程
Cursor Composer 2 深度解析:当 Kimi K2.5 成为硅谷 AI 编程的最强底座——2026 年编程 Agent 架构全解
2026-04-12 03:25:06 +0800 CST
view 926
深度解析 Cursor Composer 2 的技术架构、训练方法论、多智能体工作流与 MCP 协议集成
AI编程
Cursor
Composer
Kimi
Agent
MCP
从"盯着AI写代码"到"管理AI团队工作":OpenAI Symphony 如何定义AI智能体的工程化编排
编程
从"盯着AI写代码"到"管理AI团队工作":OpenAI Symphony 如何定义AI智能体的工程化编排
2026-05-11 11:24:58 +0800 CST
view 300
OpenAI 发布 Symphony 开源规范,连接 Linear 任务追踪与 Codex AI 智能体,实现多 Agent 并行编排、隔离工作空间、CI 自动触发、PR 自动管理的工程闭环。本文解析四大核心组件、SPEC.md 规范、Elixir/OTP 参考实现。
OpenAI Symphony,AI智能体编排,Linear集成,Codex,多Agent协作,Elixir OTP,PR管理,CI/CD自动化
cognee:仅用6行代码构建AI Agent记忆的知识引擎,15K星背后的工程哲学
编程
cognee:仅用6行代码构建AI Agent记忆的知识引擎,15K星背后的工程哲学
2026-04-20 18:46:00 +0800 CST
view 430
深度解析cognee——仅用6行代码为任意AI Agent添加记忆能力的开源知识引擎,15K星背后的图谱+向量双轨架构设计
AI Agent
记忆系统
Python
知识图谱
RAG
开源
AI编程工具三大流派深度解析:Cursor做手、Claude Code做脑、Codex做腿,2026年怎么选?
编程
AI编程工具三大流派深度解析:Cursor做手、Claude Code做脑、Codex做腿,2026年怎么选?
2026-05-11 12:42:16 +0800 CST
view 338
Claude Code、Cursor、Codex代表三种截然不同的AI编程哲学:终端原生、AI原生IDE、异步云端代理。本文从六个核心战场拆解三者真实适用场景,给出不同预算的最优组合方案,以及三位一体工作流实操指南。
AI编程
Claude Code
Cursor
Codex
Agent
MCP
编程工具
2026
DeepSeek-TUI 深度解析:Rust 打造的终端 AI 编程 Agent——从 1M 上下文到 RLM 多智能体并发的完整技术架构
编程
DeepSeek-TUI 深度解析:Rust 打造的终端 AI 编程 Agent——从 1M 上下文到 RLM 多智能体并发的完整技术架构
2026-05-17 07:14:51 +0800 CST
view 280
深度拆解 DeepSeek-TUI:99.3% Rust 编写的终端 AI 编程 Agent,1M 上下文、RLM 多智能体并发、前缀缓存优化、OS 级沙箱的完整技术架构与实战指南
DeepSeek
AI编程
Rust
终端Agent
开源项目
免费 + 100万上下文 + 内置搜索:Gemini CLI 凭什么挑战 Claude Code?
编程
免费 + 100万上下文 + 内置搜索:Gemini CLI 凭什么挑战 Claude Code?
2026-05-11 12:52:32 +0800 CST
view 283
Google 开源 Gemini CLI,Apache 2.0 许可,完全免费,100万 token 上下文全部可用,内置 Google 搜索增强,支持 Skills/MCP/Hooks 系统,CI/CD 集成完整。本文深度对比与 Claude Code 的差异、实战场景和最佳实践。
Gemini CLI,Claude Code,AI编程工具,Google,100万token上下文,MCP协议,Skills系统,免费AI助手,终端编程
Claude Opus 4.8 深度实战:Dynamic Workflows 如何让单个开发者指挥百个 AI Agent 并行编码——从混合推理架构到生产级多智能体调度的完全指南(2026)
编程
Claude Opus 4.8 深度实战:Dynamic Workflows 如何让单个开发者指挥百个 AI Agent 并行编码——从混合推理架构到生产级多智能体调度的完全指南(2026)
2026-06-03 03:15:05 +0800 CST
view 93
深度解析 Claude Opus 4.8 的 Dynamic Workflows 多智能体并行编码能力,涵盖混合推理架构、Effort Control 推理控制、诚实性对齐改进,附完整 Python 调度器实现和代码审查流水线实战
Claude
Opus 4.8
Dynamic Workflows
AI Agent
混合推理
多智能体
AI 递归自我改进深度解析:从 80% 代码由 Claude 撰写到 2028 RSI 临界点
编程
AI 递归自我改进深度解析:从 80% 代码由 Claude 撰写到 2028 RSI 临界点
2026-06-12 11:51:07 +0800 CST
view 15
深度解析 Anthropic 官方报告《When AI Builds Itself》:80% 代码由 AI 撰写、工程师产能暴涨 8 倍、RSI 每 4 个月翻一番,2028 年或达临界点。附完整架构与代码实现。
AI
Anthropic
RSI
递归自我改进
Claude
AI编程
Agent
LangGraph 2026 生产级深度实战:从有状态图编排到企业级多租户 Agent 平台——AI Agent 工程化完全指南
编程
LangGraph 2026 生产级深度实战:从有状态图编排到企业级多租户 Agent 平台——AI Agent 工程化完全指南
2026-05-23 23:32:58 +0800 CST
view 186
2026 年 AI Agent 工程化完全指南,深度剖析 LangGraph 有状态图架构、持久化机制、人工介入、性能优化及企业级多租户部署,附完整研究助手项目实战代码。
LangGraph
AI Agent
Python
生产级
多租户
Supermemory 深度实战:AI 时代的记忆引擎完全指南——从混合检索到知识图谱的架构全解析(2026)
编程
Supermemory 深度实战:AI 时代的记忆引擎完全指南——从混合检索到知识图谱的架构全解析(2026)
2026-06-03 03:46:07 +0800 CST
view 202
Supermemory 深度实战:从混合检索到知识图谱的架构全解析。GitHub 24,537 ⭐,单日 677 stars,LongMemEval 85.2% SOTA。完整代码示例,生产级部署。
AI Agent
Supermemory
记忆引擎
RAG
知识图谱
TypeScript
生产实战
DeerFlow 2.0 深度解析:字节跳动如何让 AI 从"聊天"进化到"真正干活"
编程
DeerFlow 2.0 深度解析:字节跳动如何让 AI 从"聊天"进化到"真正干活"
2026-05-11 13:22:57 +0800 CST
view 278
字节跳动开源超级智能体框架 DeerFlow 2.0,50K+ Stars,Docker沙箱执行环境、多智能体协作、长期记忆系统、Markdown技能系统。解决传统AI"记性差、不敢乱动、只能动嘴"三大痛点,实现从分钟级到小时级复杂任务自动化。
DeerFlow,字节跳动,SuperAgent,Docker沙箱,多智能体协作,长期记忆,技能系统,AI生产力,LinuxFoundation,LangGraph
DeepSeek-TUI:终端里的 Claude Code,Rust 重写让 AI 编程助手轻到飞起
编程
DeepSeek-TUI:终端里的 Claude Code,Rust 重写让 AI 编程助手轻到飞起
2026-05-11 14:25:25 +0800 CST
view 261
DeepSeek-TUI由美国独立开发者Hunter Bown用Rust编写,是DeepSeek版的Claude Code。支持1M token上下文、流式推理可视化、Plan/Agent/YOLO三种模式、MCP协议、LSP诊断。成本仅为Claude Code的1/10,MIT开源,单二进制无运行时依赖。
DeepSeek-TUI,Hunter Bown,Rust,Claude Code替代,终端AI助手,AI编程,Agent模式,YOLO模式,DeepSeek V4,MCP协议
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 308
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Obsidian Agent Skills 深度解析:从知识库到自动化工作流的工程实践
编程
Obsidian Agent Skills 深度解析:从知识库到自动化工作流的工程实践
2026-04-12 08:54:32 +0800 CST
view 523
深度解析 Obsidian Agent Skills 的工程架构:四层架构设计、Skill Registry 路由机制、与 MCP 的关系,以及如何从零构建 AI 辅助的论文写作工作流。
Obsidian
Agent Skills
知识管理
AI
自动化工作流
OpenClaw
MCP
DeerFlow 2.0 深度解析:57K Star 背后的超级智能体编排革命
编程
DeerFlow 2.0 深度解析:57K Star 背后的超级智能体编排革命
2026-04-21 04:15:29 +0800 CST
view 347
深度解析字节跳动开源的 DeerFlow 2.0 超级智能体框架:四层架构设计、子智能体编排、沙箱执行环境、长期记忆系统、技能系统等核心技术,以及实战案例与选型建议。
AI Agent
DeerFlow
智能体
字节跳动
开源框架
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
编程
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
2026-05-02 08:05:40 +0800 CST
view 493
深度拆解 GitHub Trending 开源项目 Context-Mode:通过沙箱隔离、会话连续性、代码思维和输出压缩四维度,实现 AI 编程代理上下文窗口 98% 压缩,支持 14 个平台
AI编程
上下文优化
MCP
Context-Mode
AI Agent
Agent Skills 深度解析:Addy Osmani 如何用纯 Markdown 给 AI 编程助手装上「工程纪律」
编程
Agent Skills 深度解析:Addy Osmani 如何用纯 Markdown 给 AI 编程助手装上「工程纪律」
2026-05-11 15:53:36 +0800 CST
view 266
Google Chrome 工程总监 Addy Osmani 发布了一个名为 agent-skills 的开源项目,通过将 Google 内部严苛的工程规范编码为 AI Agent 可直接执行的纯 Markdown 工作流,让 AI 编程助手从「能跑就行」进化到「可以安全合并」。
Agent Skills
AI编程
Addy Osmani
Claude Code
工程规范
Cursor
Markdown
工作流
Google工程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 262
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Claude-Tap 深度实战:AI Agent 领域的 Wireshark——从代理拦截原理到全客户端 Trace 调试的完全指南(2026)
编程
Claude-Tap 深度实战:AI Agent 领域的 Wireshark——从代理拦截原理到全客户端 Trace 调试的完全指南(2026)
2026-06-03 07:48:03 +0800 CST
view 242
claude-tap是AI Agent领域的Wireshark,本文深入解析其反向代理与正向代理架构原理、支持11个主流客户端的完整用法、Token用量分析、请求Diff对比等核心功能
AI Agent
调试工具
Claude Code
API代理
开源项目
MemPalace 深度实战:当记忆宫殿遇上 AI Agent——从 2000 年前认知术到 96.6% 召回率的本地记忆系统完全指南(2026)
编程
MemPalace 深度实战:当记忆宫殿遇上 AI Agent——从 2000 年前认知术到 96.6% 召回率的本地记忆系统完全指南(2026)
2026-06-12 15:20:19 +0800 CST
view 9
从 2000 年前古希腊记忆术到 96.6% R@5 的 AI 本地记忆系统,深度解析 MemPalace 的 Wing/Room/Drawer 架构、可插拔后端设计与 MCP 集成实践
AI记忆
MemPalace
MCP
向量检索
RAG
本地部署
Python
AI Agent
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
9
10
11
12
13
...
24
下一页