程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 189
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
无服务器代码图谱与最小化自我进化AI Agent:GitNexus与GenericAgent的技术原理与集成方案
编程
无服务器代码图谱与最小化自我进化AI Agent:GitNexus与GenericAgent的技术原理与集成方案
2026-04-20 16:48:51 +0800 CST
view 290
深入解析GitNexus(浏览器内零服务器代码知识图谱引擎)与GenericAgent(3.3K行极简自我进化Agent)的架构设计,探讨极简约束下的涌现智能范式。
AI Agent
GitNexus
GenericAgent
知识图谱
Graph RAG
自我进化
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 172
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
极简约束的胜利:GitNexus浏览器代码图谱与GenericAgent进化Agent的架构共振
编程
极简约束的胜利:GitNexus浏览器代码图谱与GenericAgent进化Agent的架构共振
2026-04-20 16:49:56 +0800 CST
view 316
深入解析GitNexus(浏览器内零服务器代码知识图谱引擎)与GenericAgent(3.3K行极简自我进化Agent)的架构设计,探讨极简约束下的涌现智能范式。
AI Agent
GitNexus
GenericAgent
知识图谱
Graph RAG
自我进化
71.4K Stars!TradingAgents 如何用多智能体重构金融交易决策流程
编程
71.4K Stars!TradingAgents 如何用多智能体重构金融交易决策流程
2026-05-11 10:22:31 +0800 CST
view 253
TradingAgents 在 GitHub 斩获 71.4K+ Stars,用多智能体模拟华尔街投研团队:基本面、情绪、新闻、技术分析师协作,看多看空研究员辩论,风控把关,组合经理审批。本文深度解析五层架构、辩论机制、LangGraph 工作流、风控体系,以及如何用 Docker 一键部署你的 AI 投研团队。
TradingAgents
多智能体
金融AI
LangGraph
投资决策
Agent架构
量化交易
风控体系
Flowsint 深度实战:开源情报图形调查平台完全指南——从实体关联分析到自动化情报收集的工程化实践(2026)
编程
Flowsint 深度实战:开源情报图形调查平台完全指南——从实体关联分析到自动化情报收集的工程化实践(2026)
2026-06-02 23:14:35 +0800 CST
view 48
Flowsint 是一个现代化的开源情报(OSINT)图形调查平台,通过可视化、灵活且可扩展的架构,让复杂的情报关联分析变得直观高效。本文深入剖析 Flowsint 的架构设计、核心功能、实战部署和高级用法。
OSINT
网络安全
开源情报
图形数据库
Flowsint
MCP + A2A 双协议时代:2026 AI Agent 互操作标准全景解析
编程
MCP + A2A 双协议时代:2026 AI Agent 互操作标准全景解析
2026-04-12 02:23:58 +0800 CST
view 761
深度解析2026年AI Agent互操作领域的两大核心协议MCP与A2A的设计理念、核心架构、代码实战与演进方向,探讨多Agent系统从单体走向协作的技术路径。
AI Agent
MCP
A2A
大模型
协议标准
2026技术趋势
Agent互操作
OpenClaw 深度实战:37万星背后的AI Agent工程化完全指南——从Pi Agent内核到生产级多信道部署(2026)
编程
OpenClaw 深度实战:37万星背后的AI Agent工程化完全指南——从Pi Agent内核到生产级多信道部署(2026)
2026-06-03 00:16:22 +0800 CST
view 39
OpenClaw在60天内星标突破37万,超越React十年积累。本文从Pi Agent极简内核、Skill热插拔机制、LCM无损上下文、多Agent协作四个维度,完整拆解OpenClaw的设计哲学与工程实践。
OpenClaw
AI Agent
Pi Agent
开源
Skill机制
LCM
教程
DeepSeek-TUI:终端里的 Claude Code,Rust 重写让 AI 编程助手轻到飞起
编程
DeepSeek-TUI:终端里的 Claude Code,Rust 重写让 AI 编程助手轻到飞起
2026-05-11 14:25:25 +0800 CST
view 210
DeepSeek-TUI由美国独立开发者Hunter Bown用Rust编写,是DeepSeek版的Claude Code。支持1M token上下文、流式推理可视化、Plan/Agent/YOLO三种模式、MCP协议、LSP诊断。成本仅为Claude Code的1/10,MIT开源,单二进制无运行时依赖。
DeepSeek-TUI,Hunter Bown,Rust,Claude Code替代,终端AI助手,AI编程,Agent模式,YOLO模式,DeepSeek V4,MCP协议
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 249
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
编程
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
2026-05-02 08:05:40 +0800 CST
view 379
深度拆解 GitHub Trending 开源项目 Context-Mode:通过沙箱隔离、会话连续性、代码思维和输出压缩四维度,实现 AI 编程代理上下文窗口 98% 压缩,支持 14 个平台
AI编程
上下文优化
MCP
Context-Mode
AI Agent
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 217
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Ruflo深度解析:从单兵作战到AI蜂群指挥系统——40+K Stars的多智能体编排引擎全维度技术剖析
编程
Ruflo深度解析:从单兵作战到AI蜂群指挥系统——40+K Stars的多智能体编排引擎全维度技术剖析
2026-05-11 18:28:13 +0800 CST
view 296
Ruflo(48K+ Stars,v3.6.30)是面向Claude Code的多智能体编排平台,用100+专业化Agent、分布式共识算法和自学习记忆系统,让AI从单兵作战升级为蜂群协作。
Ruflo,Claude Code,多智能体编排,AI编程,Swarm协调,分布式共识,Agent,AI Agent,SONA,HNSW,Rust,WASM
DeerFlow 2.0 深度实战:从"半途而废"到"真正干活"——字节跳动开源超级 Agent Harness 完全指南(2026)
编程
DeerFlow 2.0 深度实战:从"半途而废"到"真正干活"——字节跳动开源超级 Agent Harness 完全指南(2026)
2026-05-24 06:02:50 +0800 CST
view 183
DeerFlow 2.0 是字节跳动开源的超级 Agent 框架,提供沙箱执行、持久化记忆、多 Agent 编排等生产级能力。本文深入剖析其架构设计、三层沙箱机制、记忆系统和实战案例。
AI Agent
DeerFlow
字节跳动
LangGraph
多Agent编排
Anthropic官方金融AI方案:Claude for Financial Services如何用10个Agent重新定义华尔街工作流
编程
Anthropic官方金融AI方案:Claude for Financial Services如何用10个Agent重新定义华尔街工作流
2026-05-11 19:21:53 +0800 CST
view 296
Anthropic官方发布金融AI方案,含10个专业Agent、41项技能、11个MCP数据连接器,覆盖投行/PE/财富管理六大场景,效率提升8-72倍。
Anthropic
Claude
金融AI
MCP
华尔街
Agent Skills
投资银行
合规
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
编程
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
2026-06-03 15:17:28 +0800 CST
view 23
深入解析 GetStream 开源的 Vision-Agents 框架,从架构设计、视频处理管道、多模态LLM集成、RAG知识库、MCP工具调用到Kubernetes生产部署的完整实战指南
Vision-Agents
GetStream
多模态AI
视频AI
Agent
WebRTC
低延迟
RAG
Microsoft Agent Lightning 深度实战:零代码变更优化AI代理的强化学习完全指南(2026)
编程
Microsoft Agent Lightning 深度实战:零代码变更优化AI代理的强化学习完全指南(2026)
2026-05-24 15:00:19 +0800 CST
view 127
深度解析Microsoft Agent Lightning框架,探讨如何通过零代码变更方式优化AI代理,包括架构分析、代码实战和性能优化
AI Agent
强化学习
微软开源
agent训练框架
RL训练
OpenAI推出Agent包工头,但开源的Multica更狠
编程
OpenAI推出Agent包工头,但开源的Multica更狠
2026-05-12 06:47:45 +0800 CST
view 185
OpenAI官方推出Symphony作为Agent包工头,但只能管Codex。开源的Multica更狠——厂商中立,支持Claude Code、Codex、GitHub Copilot CLI、OpenClaw、Hermes、Cursor Agent、Kimi等一整个AI团队同时干活。
Multica
Symphony
Agent编排
多Agent协作
开源
Claude Code
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
编程
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
2026-05-04 16:23:37 +0800 CST
view 456
深度解析 Ruflo Agent 编排平台:100+专业化Agent、SONA自学习神经网络、HNSW向量记忆、Swarm群体协调、零信任联邦协作。从架构设计到代码实战,全面剖析多智能体协作的工程范式。
AI Agent
Rust
WASM
Multi-Agent
Architecture
Ruflo 深度解析:39K Star 的 AI Agent 编排平台如何重塑多智能体协作
编程
Ruflo 深度解析:39K Star 的 AI Agent 编排平台如何重塑多智能体协作
2026-05-04 16:23:56 +0800 CST
view 592
深度解析 Ruflo Agent 编排平台:100+专业化Agent、SONA自学习神经网络、HNSW向量记忆、Swarm群体协调、零信任联邦协作。从架构设计到代码实战,全面剖析多智能体协作的工程范式。
AI Agent
Rust
WASM
Multi-Agent
Architecture
Claude 顾问策略深度解析:Opus做大脑、Sonnet做手脚的工程哲学
编程
Claude 顾问策略深度解析:Opus做大脑、Sonnet做手脚的工程哲学
2026-04-13 11:23:13 +0800 CST
view 373
2026年3月Anthropic发布Claude顾问策略,彻底颠覆传统AI Agent工作模式。通过让Opus退居幕后当顾问,Sonnet/Haiku冲在前面当执行者,实现性能与成本的最佳平衡。本文深度解析其技术架构、性能数据与工程实践。
Claude
AI Agent
Anthropic
Advisor Strategy
Sonnet
Haiku
Opus
DeerFlow 2.0 深度解析:从 Deep Research 到超级智能体运行时,52K Star 背后的架构设计与工程实践
编程
DeerFlow 2.0 深度解析:从 Deep Research 到超级智能体运行时,52K Star 背后的架构设计与工程实践
2026-04-23 01:10:34 +0800 CST
view 664
深度解析字节跳动开源的 DeerFlow 2.0 超级智能体框架:Lead Agent + Middleware Chain + Sub-Agents 架构设计、Docker 沙箱执行、三层记忆系统、Markdown 技能扩展、Context Engineering 上下文工程,以及完整部署实战与性能调优指南。
DeerFlow
AI Agent
LangGraph
字节跳动
开源
Docker Sandbox
Sub-Agent
长期记忆
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 602
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
DeerFlow 深度解析:字节跳动开源超级智能体运行时——从架构设计到生产级 Multi-Agent 编排的完整技术内幕
编程
DeerFlow 深度解析:字节跳动开源超级智能体运行时——从架构设计到生产级 Multi-Agent 编排的完整技术内幕
2026-05-18 09:43:33 +0800 CST
view 162
深入解析字节跳动开源的 DeerFlow 超级智能体运行时框架,从核心架构、执行引擎、Multi-Agent 编排到生产级部署,完整呈现这一 GitHub Trending 榜首项目的技术内幕。
AI Agent
DeerFlow
字节跳动
Multi-Agent
开源项目
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
24
25
26
27
28
...
41
下一页