程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
CodeGraph 深度实战:当 AI 编程助手学会「预索引」——从代码探索税到知识图谱的工程革命(2026)
编程
CodeGraph 深度实战:当 AI 编程助手学会「预索引」——从代码探索税到知识图谱的工程革命(2026)
2026-06-13 20:49:00 +0800 CST
view 146
CodeGraph 将代码库预索引为结构化知识图谱,让 Claude Code、Cursor 等 AI 编程助手减少 70% 工具调用和 59% Token 消耗。本文从架构原理、源码解析、生产级使用、代码实战四个维度深入剖析这一 GitHub 20 万星的开源项目。
CodeGraph
知识图谱
AI编程
Tree-sitter
代码索引
开发效率
MCP
Claude Code
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 340
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 306
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
AI Agent 可观测性深度实战:当黑箱遇见全链路追踪——从 OTel GenAI 语义规范到 LoongSuite Pilot 端侧采集、Python 零代码插桩与安全审计的生产级完全指南
编程
AI Agent 可观测性深度实战:当黑箱遇见全链路追踪——从 OTel GenAI 语义规范到 LoongSuite Pilot 端侧采集、Python 零代码插桩与安全审计的生产级完全指南
2026-06-17 11:56:08 +0800 CST
view 224
深入剖析 AI Agent 可观测性核心难题,基于阿里云 LoongSuite 开源方案,从 OTel GenAI 语义规范扩展到端侧采集、零代码插桩与安全审计的完整生产级实战指南
AI Agent
可观测性
OpenTelemetry
LoongSuite
安全审计
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
编程
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
2026-06-15 21:20:49 +0800 CST
view 143
深入解析小米MiMo UltraSpeed如何通过SWA架构在通用GPU上突破1000 tokens/s推理速度,从O(n²)困境到极致跨越的完整技术指南。
SWA
Sliding Window Attention
LLM推理
小米MiMo
推理优化
Transformer
PagedAttention
量化推理
端侧AI
eBPF驱动的可观测性革命:零侵入自动采集、3%节点开销替代Sidecar 10%损耗——Grafana Beyla、DeepFlow与Cilium Hubble生产级深度实战
编程
eBPF驱动的可观测性革命:零侵入自动采集、3%节点开销替代Sidecar 10%损耗——Grafana Beyla、DeepFlow与Cilium Hubble生产级深度实战
2026-06-01 16:24:33 +0800 CST
view 230
eBPF正在重塑云原生可观测性:无需Sidecar、无需代码修改,内核级采集3%节点开销替代传统10%损耗。深度对比Grafana Beyla v3.6、DeepFlow v7.0 LTS、Cilium Hubble三大eBPF可观测性工具链的生产实战。
eBPF
Grafana Beyla
DeepFlow
Cilium
Kubernetes
可观测性
OpenTelemetry
性能优化
OpenTelemetry Collector 生产级部署:从架构设计到 eBPF 无侵入可观测性的完整实战
编程
OpenTelemetry Collector 生产级部署:从架构设计到 eBPF 无侵入可观测性的完整实战
2026-04-29 14:20:56 +0800 CST
view 379
深度解析 OpenTelemetry Collector 生产级部署架构,从 Gateway+Agent 模式到 eBPF 无侵入可观测性,涵盖批处理优化、尾部采样、高可用设计与性能调优完整实战
OpenTelemetry
eBPF
可观测性
云原生
Kubernetes
分布式追踪
从Token内卷到DAA崛起:百度Create2026重新定义AI价值度量衡
编程
从Token内卷到DAA崛起:百度Create2026重新定义AI价值度量衡
2026-05-16 17:21:12 +0800 CST
view 368
2026年5月百度Create2026大会,李彦宏首提DAA(日活智能体数)作为AI时代度量衡。本文深度解析这一概念的战略意义,以及百度DuMate、秒哒、伐谋等Agent产品的技术架构。
百度
DAA
AI Agent
Create2026
DuMate
秒哒
伐谋
智能体
AI时代度量衡
超级个体
李彦宏抛出DAA背后的AI大变局:百度搭子秒哒伐谋三箭齐发
编程
李彦宏抛出DAA背后的AI大变局:百度搭子秒哒伐谋三箭齐发
2026-05-16 17:22:10 +0800 CST
view 391
2026年5月百度Create2026大会,李彦宏首提DAA(日活智能体数)作为AI时代度量衡。本文深度解析这一概念的战略意义,以及百度DuMate、秒哒、伐谋等Agent产品的技术架构。
百度
DAA
AI Agent
Create2026
DuMate
秒哒
伐谋
智能体
AI时代度量衡
超级个体
告别Token崇拜:Create2026揭示AI时代从流量思维到价值思维的根本跃迁
编程
告别Token崇拜:Create2026揭示AI时代从流量思维到价值思维的根本跃迁
2026-05-16 17:23:01 +0800 CST
view 348
2026年5月百度Create2026大会,李彦宏首提DAA(日活智能体数)作为AI时代度量衡。本文深度解析这一概念的战略意义,以及百度DuMate、秒哒、伐谋等Agent产品的技术架构。
百度
DAA
AI Agent
Create2026
DuMate
秒哒
伐谋
智能体
AI时代度量衡
超级个体
DAA革命:为什么李彦宏说100亿日活智能体将重新定义AI价值
编程
DAA革命:为什么李彦宏说100亿日活智能体将重新定义AI价值
2026-05-16 17:23:50 +0800 CST
view 301
2026年5月百度Create2026,李彦宏提出DAA(日活智能体数)替代Token成为AI时代新度量衡。深度解析这一概念的战略深意,以及百度DuMate、秒哒、伐谋等产品矩阵的技术内核。
百度
DAA
AI Agent
Create2026
DuMate
秒哒
伐谋
智能体
AI时代度量衡
超级个体
日活智能体数DAA替代Token:百度Create2026透露了哪些AI行业真相
编程
日活智能体数DAA替代Token:百度Create2026透露了哪些AI行业真相
2026-05-16 17:24:43 +0800 CST
view 312
2026年5月百度Create2026,李彦宏提出DAA(日活智能体数)替代Token成为AI时代新度量衡。深度解析这一概念的战略深意,以及百度DuMate、秒哒、伐谋等产品矩阵的技术内核。
百度
DAA
AI Agent
Create2026
DuMate
秒哒
伐谋
智能体
AI时代度量衡
超级个体
李彦宏的AI新度量衡:Token是成本DAA才是价值(Create2026深度复盘)
编程
李彦宏的AI新度量衡:Token是成本DAA才是价值(Create2026深度复盘)
2026-05-16 17:25:28 +0800 CST
view 339
2026年5月百度Create2026,李彦宏提出DAA(日活智能体数)替代Token成为AI时代新度量衡。深度解析这一概念的战略深意,以及百度DuMate、秒哒、伐谋等产品矩阵的技术内核。
百度
DAA
AI Agent
Create2026
DuMate
秒哒
伐谋
智能体
AI时代度量衡
超级个体
SGLang 深度解析:RadixAttention 如何重塑大模型推理的「结构化革命」
编程
SGLang 深度解析:RadixAttention 如何重塑大模型推理的「结构化革命」
2026-06-30 11:16:18 +0800 CST
view 11
深度解析 SGLang 大模型推理框架:RadixAttention 前缀缓存、零开销 CPU 调度器、结构化输出约束、推测解码、PD 分离等核心技术,对比 vLLM/TensorRT-LLM 选型,提供完整代码示例与生产级部署实践
SGLang
大模型推理
RadixAttention
前缀缓存
结构化输出
推测解码
PD分离
vLLM
TensorRT-LLM
SGLang 深度解析:RadixAttention 前缀缓存与结构化 LLM 推理革命——从 RAG/Agent 场景到生产级部署的完整指南
编程
SGLang 深度解析:RadixAttention 前缀缓存与结构化 LLM 推理革命——从 RAG/Agent 场景到生产级部署的完整指南
2026-06-30 11:17:15 +0800 CST
view 11
深度解析 SGLang 大模型推理框架:RadixAttention 前缀缓存、零开销 CPU 调度器、结构化输出约束、推测解码、PD 分离等核心技术,对比 vLLM/TensorRT-LLM 选型,提供完整代码示例与生产级部署实践
SGLang
大模型推理
RadixAttention
前缀缓存
结构化输出
推测解码
PD分离
vLLM
TensorRT-LLM
eBPF + OpenTelemetry:零侵入可观测性的技术革命——从内核探针到生产级分布式追踪的完整实战指南(2026)
编程
eBPF + OpenTelemetry:零侵入可观测性的技术革命——从内核探针到生产级分布式追踪的完整实战指南(2026)
2026-06-23 11:26:27 +0800 CST
view 172
eBPF + OpenTelemetry:零侵入可观测性的技术革命。详解OBI架构、协议感知型探测、Go/Python运行时集成、生产级部署与调优,以及AI应用可观测性的独门绝技。8000字深度实战指南。
eBPF
OpenTelemetry
可观测性
分布式追踪
云原生
Linux内核
eBPF实战
OTel
Vite 6 深度解析:构建工具的新里程碑,如何让前端开发快上加快
编程
Vite 6 深度解析:构建工具的新里程碑,如何让前端开发快上加快
2026-05-12 02:18:40 +0800 CST
view 392
深度解析Vite 6的核心架构升级:Environment API实现浏览器/SSR/Edge Workers多环境统一构建、依赖预构建并行化让冷启动缩短40%、模块级HMR让热更新延迟低于10ms、Rollup 4集成提升生产构建速度29%、完整迁移指南与破坏性变更详解
Vite6,前端构建工具,Environment API,HMR,热更新,Rollup4,esbuild,性能优化,迁移指南,React,Vue,Svelte
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
编程
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
2026-05-03 15:13:07 +0800 CST
view 468
2026年深度解析vLLM核心架构,从PagedAttention进化到多节点分布式推理,涵盖SIG社区组织、v1架构重写、生产部署实战与性能优化全链路指南。
vLLM
PagedAttention
LLM
推理优化
分布式
Kubernetes
Python
Vite+ Alpha 深度解析:VoidZero 如何用 Rust + 统一入口重新定义前端工具链
编程
Vite+ Alpha 深度解析:VoidZero 如何用 Rust + 统一入口重新定义前端工具链
2026-05-04 01:53:46 +0800 CST
view 398
Vite+ Alpha 深度解析:VoidZero 的统一前端工具链如何用 Rust 底层重写一切,从 vp CLI 到 Vite Task 缓存编排的全链路技术实战
Vite+
VoidZero
Rust
前端工具链
Rolldown
Oxlint
Oxfmt
Vite Task
Kubernetes v1.36 深度解析:当 Ingress NGINX 退役遇上 Istio 环境模式——云原生网络架构的范式革命
编程
Kubernetes v1.36 深度解析:当 Ingress NGINX 退役遇上 Istio 环境模式——云原生网络架构的范式革命
2026-04-16 04:40:40 +0800 CST
view 596
深入解析 Kubernetes v1.36 重大变革:Ingress NGINX 退役、Gateway API 崛起、Istio 环境模式多集群支持、AI 推理网关等云原生网络架构的范式革命
Kubernetes
Istio
云原生
Gateway API
服务网格
Ambient Mode
AI推理
多集群
Kubernetes v1.36 与 Istio 环境模式深度解析:云原生网络架构的范式革命——从 Ingress NGINX 退役到 AI 推理网关
编程
Kubernetes v1.36 与 Istio 环境模式深度解析:云原生网络架构的范式革命——从 Ingress NGINX 退役到 AI 推理网关
2026-04-16 04:41:31 +0800 CST
view 549
深入解析 Kubernetes v1.36 重大变革:Ingress NGINX 退役、Gateway API 崛起、Istio 环境模式多集群支持、AI 推理网关等云原生网络架构的范式革命
Kubernetes
Istio
云原生
Gateway API
服务网格
Ambient Mode
AI推理
多集群
2026 微服务可观测性深度实战:当 eBPF 遇见 OpenTelemetry——从内核级追踪到 AI 原生洞察的生产级完全指南
编程
2026 微服务可观测性深度实战:当 eBPF 遇见 OpenTelemetry——从内核级追踪到 AI 原生洞察的生产级完全指南
2026-06-06 06:37:42 +0800 CST
view 311
2026年eBPF与OpenTelemetry结合构建微服务可观测性系统,零侵入内核级追踪+标准化遥测管道+AI工作负载监控的完整实战指南
eBPF
OpenTelemetry
可观测性
Kubernetes
微服务
AI
LLM推理引擎深度实战:从PagedAttention到生产级部署,万字长文吃透2026年最关键的AI基础设施
编程
LLM推理引擎深度实战:从PagedAttention到生产级部署,万字长文吃透2026年最关键的AI基础设施
2026-06-27 12:44:29 +0800 CST
view 52
2026年LLM推理引擎深度实战:从PagedAttention、连续批处理、量化技术到生产级K8s部署,万字长文覆盖vLLM、SGLang、TensorRT-LLM、TGI四大框架架构原理与实测对比
LLM推理
vLLM
PagedAttention
SGLang
推理优化
TensorRT-LLM
生产部署
KV Cache
量化
OpenTelemetry 2026深度实战:从架构原理到生产级可观测性的完整指南
编程
OpenTelemetry 2026深度实战:从架构原理到生产级可观测性的完整指南
2026-05-19 16:18:35 +0800 CST
view 539
2026年深度实战OpenTelemetry:覆盖Trace/Metrics/Logs三大支柱原理、OTel Collector架构、Tail-based Sampling生产实战、零侵入自动埋点、多语言SDK示例,以及AI/LLM系统集成。5000字起底,干货密集。
OpenTelemetry
云原生
可观测性
链路追踪
分布式系统
Go
Python
Java
Kubernetes
性能优化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
28
29
30
31
32
...
77
下一页