程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 738
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
编程
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
2026-06-12 14:20:52 +0800 CST
view 113
深度解析 ICML 2026 接收的 CLEAR 推理优化方法。浙江大学、腾讯、北京大学联合提出:对没有希望的问题理性放弃,把算力集中到能解决的问题上。包含完整 Python 实现、vLLM/SGLang 集成、生产级部署指南。
LLM
推理优化
ICML 2026
CLEAR
算力分配
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
编程
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
2026-04-12 21:54:21 +0800 CST
view 621
深入解读 ICLR 2026 论文 LRT,揭示如何用轻量级推理网络将冗长的思维链压缩为隐式向量,实现推理效率数十倍提升
AI
LLM
推理优化
思维链
ICLR2026
ClickHouse 4亿美元D轮融资深度解析:从OLAP王者到AI数据基础设施的野心布局
编程
ClickHouse 4亿美元D轮融资深度解析:从OLAP王者到AI数据基础设施的野心布局
2026-04-22 02:18:30 +0800 CST
view 718
ClickHouse完成4亿美元D轮融资,收购Langfuse进军LLM可观测性领域,推出原生Postgres服务。深度解析ClickHouse技术架构、收购战略意义及AI数据基础设施布局。
ClickHouse
OLAP
数据库
AI基础设施
LLM可观测性
Postgres
数据分析
Spring AI 2.0 深度解析:Java 开发者终于有了自己的 AI Agent 基础设施
编程
Spring AI 2.0 深度解析:Java 开发者终于有了自己的 AI Agent 基础设施
2026-05-13 18:19:28 +0800 CST
view 579
Spring AI 2.0 核心能力全面解析:统一 ChatClient API、Tool Calling 与 Java 方法打通、结构化输出自动映射、Advisors 切面机制、RAG 企业知识库、MCP 协议集成,以及与 LangChain4j 深度对比选型指南。
Spring AI,Java,AI Agent,ChatClient,Tool Calling,RAG,MCP,LangChain4j
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
编程
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
2026-06-08 20:52:38 +0800 CST
view 143
2026年3月Google Research在ICLR 2026发表TurboQuant算法,将LLM的KV缓存压缩至3-bit,实现6倍内存缩减和8倍推理加速。本文深入剖析TurboQuant的技术原理,并提供生产级部署指南。
TurboQuant
KV缓存压缩
LLM推理优化
量化算法
Google Research
ICLR2026
Star-Office-UI:超可爱的像素风格AI办公室看板,把龙虾摸鱼状态可视化
案例
Star-Office-UI:超可爱的像素风格AI办公室看板,把龙虾摸鱼状态可视化
2026-05-09 07:16:11 +0800 CST
view 315
Star-Office-UI开源项目:像素风格的AI办公室看板,实时可视化Agent工作状态,支持多Agent协作、中英日三语、桌面宠物模式,与OpenClaw深度集成一条命令部署
OpenClaw
像素风格
AI看板
多Agent协作
桌面宠物
可视化
OpenClaw集成
ClawSwarm 深度实战:当多Agent学会「群聊协作」——从 Hub-and-Spoke 架构到生产级 AI 团队编排完全指南(2026)
编程
ClawSwarm 深度实战:当多Agent学会「群聊协作」——从 Hub-and-Spoke 架构到生产级 AI 团队编排完全指南(2026)
2026-06-12 19:47:32 +0800 CST
view 122
ClawSwarm深度实战:从Hub-and-Spoke架构到生产级多Agent协作完全指南。详解消息路由、任务拆解、Token优化,附完整代码实战。
ClawSwarm
多Agent
OpenClaw
AI协作
群聊编排
ClawKeeper 深度解析:当「用智能体监管智能体」从概念走向工程——三层防御架构如何为 OpenClaw 系上数字安全带
编程
ClawKeeper 深度解析:当「用智能体监管智能体」从概念走向工程——三层防御架构如何为 OpenClaw 系上数字安全带
2026-04-12 20:56:05 +0800 CST
view 537
深度解析智源、北邮、信通院联合发布的 ClawKeeper v1.0——首个面向 OpenClaw 的三层实时安全框架。从 CVE-2026-33579 等高危漏洞切入,详细剖析 Skill-based、Plugin-based、Watcher-based 三层防御架构的设计哲学与工程实现,探讨「用智能体监管智能体」的安全新范式。
AI安全
OpenClaw
ClawKeeper
eBPF
智能体
安全框架
拒绝劝退!基于pi-mono的轻量级AI Agent学习神器LoongClaw
编程
拒绝劝退!基于pi-mono的轻量级AI Agent学习神器LoongClaw
2026-04-22 13:28:09 +0800 CST
view 552
OpenClaw太重?LoongClaw基于pi-mono架构的轻量级AI Agent学习神器,大道至简,聚焦Agent Loop本质,适合初学者和二次开发。
LoongClaw
pi-mono
AI Agent
开源
OpenClaw
OpenCLI 深度解析:当任意网站变成零成本 CLI 工具——AI Agent 基础设施的新范式
编程
OpenCLI 深度解析:当任意网站变成零成本 CLI 工具——AI Agent 基础设施的新范式
2026-04-16 08:24:10 +0800 CST
view 707
OpenCLI 通过编译期智能、运行期零成本的设计哲学,将任意网站转化为确定性 CLI 工具。15.6k Stars,Apache Arrow PMC 成员作品,91个内置 Adapter,支持 Self-Repair Protocol 自动修复。
OpenCLI
AI Agent
CLI
CDP
浏览器自动化
Adapter
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
编程
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
2026-04-09 05:15:20 +0800 CST
view 572
2026年4月4日,Anthropic正式封杀OpenClaw,30万虾农遭遇断粮危机。本文深度解析封杀背后的商业逻辑、ClawAegis安全防护体系,以及AI Agent时代的商业模式之争。
AI Agent
OpenClW
ClawAegis
Anthropic
大模型安全
开源智能体
GitHub Copilot 2026双响炮:数据训练政策争议与Rubber Duck跨模型审查——AI编程工具的信任重建之路
编程
GitHub Copilot 2026双响炮:数据训练政策争议与Rubber Duck跨模型审查——AI编程工具的信任重建之路
2026-04-11 12:25:06 +0800 CST
view 498
深度解析2026年4月GitHub Copilot两大重磅更新:数据训练政策的隐私争议与Rubber Duck跨模型审查功能的技术原理
GitHub Copilot
Rubber Duck
AI编程
隐私政策
Copilot CLI
Odysseus 深度实战:当 YouTuber 之王用代码掀翻云端 AI 霸权——从自托管工作空间到生产级本地 Agent 的完全指南(2026)
编程
Odysseus 深度实战:当 YouTuber 之王用代码掀翻云端 AI 霸权——从自托管工作空间到生产级本地 Agent 的完全指南(2026)
2026-06-13 19:51:26 +0800 CST
view 217
PewDiePie开源的Odysseus自托管AI工作空间深度实战指南:从架构设计、LLM集成、Agent系统、记忆系统到安全架构的完全解析
Odysseus
自托管AI
PewDiePie
Agent
MCP
本地LLM
FastAPI
ChromaDB
Pullfrog 深度实战:Zod 作者打造的 GitHub Actions 原生 AI 编程 Agent——从架构原理到生产级代码审查完全指南(2026)
编程
Pullfrog 深度实战:Zod 作者打造的 GitHub Actions 原生 AI 编程 Agent——从架构原理到生产级代码审查完全指南(2026)
2026-06-05 16:38:52 +0800 CST
view 184
2026年5月,Zod作者Colin McDonnell推出Pullfrog——完全运行在GitHub Actions内的开源AI编程Agent。本文深度解析其架构设计、事件驱动模型、BYOK模式、代码实战与生产级最佳实践。
AI Agent
GitHub Actions
代码审查
Pullfrog
Zod
CI/CD
自动化
开源
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
编程
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
2026-04-21 05:16:09 +0800 CST
view 579
深入剖析 DeepSeek 开源的 DeepGEMM 库:从 FP8 精度革命到 1550 TFLOPS 性能突破,揭秘现代 AI 推理基础设施的底层优化技术
DeepGEMM
FP8
DeepSeek
CUDA
AI推理
GPU优化
GEMM
TensorCore
Visual Studio 2026 + .NET 10 深度解析:微软把 IDE 和运行时一起推上了新台阶
编程
Visual Studio 2026 + .NET 10 深度解析:微软把 IDE 和运行时一起推上了新台阶
2026-04-12 12:23:47 +0800 CST
view 677
Visual Studio 2026 和 .NET 10 深度解析:ProfilerCopilotAgent、JIT优化、NativeAOT成熟化、C# 14新特性、ASP.NET Core 10实战,全面覆盖升级要点与性能对比
Visual Studio 2026
.NET 10
C# 14
NativeAOT
ASP.NET Core
JIT
性能优化
IDE
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 434
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
Robinhood Agentic Trading 深度解析:MCP 协议如何让 AI Agent 首次掌握真实金融交易权限
编程
Robinhood Agentic Trading 深度解析:MCP 协议如何让 AI Agent 首次掌握真实金融交易权限
2026-06-01 16:55:23 +0800 CST
view 230
深度解析 Robinhood 2026年5月推出的 Agentic Trading 功能,从技术架构、协议原理、代码实现、安全模型等多维度剖析 MCP 协议如何让 AI Agent 首次获得真实金融交易权限
MCP协议
AI Agent
金融交易
Robinhood
OpenClaw
Agentic Trading 深度实战:MCP 协议让 AI Agent 首次掌握真实金融交易权限(2026)
编程
Agentic Trading 深度实战:MCP 协议让 AI Agent 首次掌握真实金融交易权限(2026)
2026-06-01 16:56:15 +0800 CST
view 202
深度解析 Robinhood 2026年5月推出的 Agentic Trading 功能,从技术架构、协议原理、代码实现、安全模型等多维度剖析 MCP 协议如何让 AI Agent 首次获得真实金融交易权限
MCP协议
AI Agent
金融交易
Robinhood
OpenClaw
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
编程
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
2026-05-11 09:52:48 +0800 CST
view 418
智谱AI发布GLM-5V-Turbo多模态编程基座模型,从预训练阶段原生融合视觉与语言,在Design2Code基准测试中以94.8分超越所有竞品。本文深度解析CogViT视觉编码器、MMTP多模态多Token预测、多任务RL优化等技术细节,以及如何用API接入实现从设计稿到可运行代码的完整工作流。
GLM-5V-Turbo
视觉编程
Design2Code
多模态
CogViT
MMTP
智谱AI
AI编程
VS Code 强制注入 Copilot 签名事件深度解析:从技术实现到法律边界的全链路剖析
编程
VS Code 强制注入 Copilot 签名事件深度解析:从技术实现到法律边界的全链路剖析
2026-05-04 03:24:14 +0800 CST
view 431
深度解析VS Code强制注入Copilot签名事件,从技术实现、法律风险到社区应对方案的全链路剖析
VS Code
Git
Copilot
开源合规
AI伦理
VS Code Copilot签名强制注入事件全链路剖析:技术实现、法律风险与社区应对
编程
VS Code Copilot签名强制注入事件全链路剖析:技术实现、法律风险与社区应对
2026-05-04 03:24:52 +0800 CST
view 611
深度解析VS Code强制注入Copilot签名事件,从技术实现、法律风险到社区应对方案的全链路剖析
VS Code
Git
Copilot
开源合规
AI伦理
MCP 深度解析:Model Context Protocol 如何重塑 AI 应用开发——从协议设计到生产级实战的完整技术内幕
编程
MCP 深度解析:Model Context Protocol 如何重塑 AI 应用开发——从协议设计到生产级实战的完整技术内幕
2026-05-18 02:15:34 +0800 CST
view 263
深入解析 Anthropic MCP 协议的设计哲学、架构实现、开发实战与生产级部署
MCP
Model Context Protocol
AI应用开发
协议设计
工具集成
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
17
18
19
20
21
...
40
下一页