程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
TypeScript Go 深度实战:10倍性能跃升的编译器革命——从 JavaScript 到 Go 的原生移植全链路解析
编程
TypeScript Go 深度实战:10倍性能跃升的编译器革命——从 JavaScript 到 Go 的原生移植全链路解析
2026-05-08 12:36:48 +0800 CST
view 427
TypeScript Go 原生移植深度解析:从 JavaScript 到 Go 的编译器架构革命,10倍性能提升背后的并行化、内存优化与原生执行策略
TypeScript
Go
编译器
性能优化
LSP
PostgreSQL 18 深度实战:从异步I/O到跳跃扫描,数据库内核的三年一剑
编程
PostgreSQL 18 深度实战:从异步I/O到跳跃扫描,数据库内核的三年一剑
2026-05-21 23:50:18 +0800 CST
view 346
PostgreSQL 18深度解析:异步I/O架构变革实现3倍性能提升,Index Skip Scan解放复合索引,uuidv7原生支持,OAuth2.0认证,虚拟生成列等核心新特性实战指南
PostgreSQL
数据库
异步IO
Index Skip Scan
性能优化
OpenCode 深度解析:150K Stars 的开源终端 AI 编程代理,Claude Code 的最强开源替代
编程
OpenCode 深度解析:150K Stars 的开源终端 AI 编程代理,Claude Code 的最强开源替代
2026-05-15 17:14:32 +0800 CST
view 453
OpenCode 是 150K Stars 的开源终端 AI 编程代理,支持 75+ 模型提供商、内置 LSP、MCP 协议、客户端/服务器架构,是 Claude Code 的最强开源替代
OpenCode
AI编程
终端工具
开源
Claude Code替代
MCP
LSP
Chrome DevTools MCP 深度实战:当浏览器调试遇上 AI 代理——从 CDP 协议到智能调试助手的完全指南(2026)
编程
Chrome DevTools MCP 深度实战:当浏览器调试遇上 AI 代理——从 CDP 协议到智能调试助手的完全指南(2026)
2026-06-09 22:48:53 +0800 CST
view 213
Chrome DevTools Protocol (CDP) 与 Model Context Protocol (MCP) 的深度融合,让 AI Agent 直接操控浏览器、读取 DOM、监控网络,彻底改变前端调试和自动化范式。
Chrome DevTools
MCP协议
CDP
AI调试
浏览器自动化
Vue 3.5 深度实战:响应式系统重构与性能飞跃——从双向链表到版本计数的内存优化革命
编程
Vue 3.5 深度实战:响应式系统重构与性能飞跃——从双向链表到版本计数的内存优化革命
2026-05-22 05:20:15 +0800 CST
view 359
深度解析 Vue 3.5 响应式系统的颠覆性重构:双向链表与版本计数机制如何让内存占用减少56%、数组操作性能提升10倍。从架构原理到源码实现,再到生产级优化策略的完整指南。
Vue 3.5
响应式系统
双向链表
版本计数
性能优化
内存优化
Preact Signals
PostgreSQL 18 深度实战:异步 I/O 3 倍提速、Skip Scan、虚拟生成列、UUIDv7 与 Wire Protocol 3.2——从内核架构到生产级迁移的完全指南(2026)
编程
PostgreSQL 18 深度实战:异步 I/O 3 倍提速、Skip Scan、虚拟生成列、UUIDv7 与 Wire Protocol 3.2——从内核架构到生产级迁移的完全指南(2026)
2026-05-31 07:22:51 +0800 CST
view 243
PostgreSQL 18 深度实战指南:异步I/O子系统3倍提速、Skip Scan多列索引优化、虚拟生成列、UUIDv7时序UUID、Wire Protocol 3.2、时态约束、OAuth 2.0认证与生产级迁移完全指南
PostgreSQL
数据库
异步IO
UUIDv7
Skip Scan
不用 root 也能抓包:httptap 的 eBPF 魔法与 Go 实现深度剖析
编程
不用 root 也能抓包:httptap 的 eBPF 魔法与 Go 实现深度剖析
2026-06-29 02:42:01 +0800 CST
view 70
深入剖析 httptap 开源项目,讲解如何利用 eBPF uprobe 技术无需 root 权限透明抓取任意 Linux 程序的 HTTP/HTTPS 流量,包含完整 Go 实现代码示例。
eBPF
Go语言
Linux内核
网络抓包
TLS解密
性能观测
开源项目
httptap
Brunost:一个强制使用挪威语Nynorsk编写代码的编程语言——深度解析与实战
编程
Brunost:一个强制使用挪威语Nynorsk编写代码的编程语言——深度解析与实战
2026-04-18 13:16:43 +0800 CST
view 486
深入解析Brunost:一款用Zig编写、强制使用挪威语Nynorsk书写代码的函数式编程语言。涵盖语法、架构设计、实战代码、性能分析。
Brunost
Nynorsk
编程语言
Zig
WebAssembly
函数式编程
Gleam
自然语言编程
PostgreSQL 18 深度实战:异步 I/O + Skip Scan 索引革命——从 3 倍性能跃升到零运维升级的生产级完全指南(2026)
编程
PostgreSQL 18 深度实战:异步 I/O + Skip Scan 索引革命——从 3 倍性能跃升到零运维升级的生产级完全指南(2026)
2026-06-21 12:28:30 +0800 CST
view 210
深入解析 PostgreSQL 18 六大核心新特性:异步 I/O(AIO)实现 3 倍性能提升、Skip Scan 索引优化、Planner 统计信息跨版本保留、UUIDv7 时间有序主键、虚拟生成列默认模式、以及精细化 I/O 监控体系。含架构解析、代码示例和性能基准数据。
PostgreSQL
数据库
AIO
性能优化
Skip Scan
索引
LLM推理框架2026选型完全指南:从vLLM到TensorRT-LLM,一次讲透四大引擎的架构哲学与生产级实战
编程
LLM推理框架2026选型完全指南:从vLLM到TensorRT-LLM,一次讲透四大引擎的架构哲学与生产级实战
2026-06-02 09:36:52 +0800 CST
view 371
从vLLM到TensorRT-LLM,一次讲透vLLM、SGLang、TensorRT-LLM、llama.cpp四大LLM推理框架的架构哲学、核心原理、生产级部署实战与选型决策树。
LLM
vLLM
TensorRT-LLM
llama.cpp
SGLang
推理优化
GPU
LLM推理引擎深度实战:从PagedAttention到生产级部署,万字长文吃透2026年最关键的AI基础设施
编程
LLM推理引擎深度实战:从PagedAttention到生产级部署,万字长文吃透2026年最关键的AI基础设施
2026-06-27 12:44:29 +0800 CST
view 106
2026年LLM推理引擎深度实战:从PagedAttention、连续批处理、量化技术到生产级K8s部署,万字长文覆盖vLLM、SGLang、TensorRT-LLM、TGI四大框架架构原理与实测对比
LLM推理
vLLM
PagedAttention
SGLang
推理优化
TensorRT-LLM
生产部署
KV Cache
量化
万字深度解析 Nano-vLLM:当1200行Python代码重构大模型推理——从架构设计到性能超越vLLM的完整技术指南(2026)
编程
万字深度解析 Nano-vLLM:当1200行Python代码重构大模型推理——从架构设计到性能超越vLLM的完整技术指南(2026)
2026-07-01 14:44:55 +0800 CST
view 43
Nano-vLLM:用约1200行Python代码实现的轻量级vLLM替代方案。深度解析KV Cache管理、GQA注意力、RoPE位置编码、Continuous Batching等核心技术,Benchmark性能超越vLLM 5.3%。适合学习大模型推理原理和内网轻量级部署。
Nano-vLLM
大模型推理
LLM
Tensor Parallelism
KV Cache
Continuous Batching
Python
PyTorch
Qwen2
开源项目
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
编程
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
2026-05-22 06:19:51 +0800 CST
view 432
深入解析TensorRT-LLM推理框架,从Paged KV Cache、连续批处理到INT4/INT8/FP8量化实战,覆盖Blackwell架构适配、Triton部署与K8s生产方案
TensorRT-LLM
LLM推理
量化
INT4
Blackwell
GPU优化
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
编程
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
2026-06-21 08:54:17 +0800 CST
view 276
Ollama 0.30 深度解析:双引擎推理架构、Gemma 4 QAT、Cohere2 MoE、ollama launch 生态与生产级部署完全指南
Ollama
LLM
本地推理
AI编程
llama.cpp
MLX
Gemma
开源
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
编程
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
2026-04-20 13:45:31 +0800 CST
view 640
深度对比vLLM与TensorRT-LLM两大LLM推理框架,从PagedAttention到Kernel Fusion,从量化技术到生产部署,助你做出正确的技术选型决策
LLM
vLLM
TensorRT-LLM
推理优化
大模型部署
量化技术
AI工程
2026大模型推理框架年度横评:vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南
编程
2026大模型推理框架年度横评:vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南
2026-06-18 17:54:54 +0800 CST
view 283
深度横评2026年四大主流大模型推理框架,涵盖PagedAttention架构、ContinuousBatching、算子融合、FP8量化、NVMe卸载等核心技术,配实测数据与生产级选型指南
大模型
LLM
推理框架
vLLM
TensorRT-LLM
TGI
DeepSpeed
GPU推理
AI部署
NVIDIA
Ollama 深度实战:当本地大模型成为生产级基础设施——从模型量化到高并发推理、从 REST API 到 Kubernetes 部署的完全指南(2026)
编程
Ollama 深度实战:当本地大模型成为生产级基础设施——从模型量化到高并发推理、从 REST API 到 Kubernetes 部署的完全指南(2026)
2026-06-20 01:25:22 +0800 CST
view 288
Ollama本地大模型生产级部署完全指南:从GGUF格式原理、INT4/INT8量化实战、REST API集成、多语言SDK(Python/Go/TypeScript)、GPU显存管理、Kubernetes+Helm生产部署、性能调优到RAG知识库构建,全流程深度实战。
Ollama
本地大模型
LLM部署
模型量化
GGUF
llama.cpp
REST API
Kubernetes
GPU
RAG
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 411
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 396
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 831
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
2026-06-10 10:17:56 +0800 CST
view 197
深度解析 vLLM 的核心架构 PagedAttention 和 Continuous Batching,从内存管理原理到生产级分布式部署的完全指南。
vLLM
LLM推理
PagedAttention
GPU优化
大模型部署
AI推理
vLLM 2026 推理引擎全解:从 PagedAttention 到分离式 Prefill,如何把大模型跑出 GPU 极限性能
编程
vLLM 2026 推理引擎全解:从 PagedAttention 到分离式 Prefill,如何把大模型跑出 GPU 极限性能
2026-06-29 17:16:04 +0800 CST
view 98
2026年vLLM 0.18深度解析:PagedAttention显存管理、EAGLE3推测解码、连续批处理、分离式Prefill、FP4量化,附生产级部署代码与Benchmark对比
vLLM
LLM推理
PagedAttention
推测解码
EAGLE3
FP4量化
CUDA
GPU性能优化
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
编程
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
2026-06-29 17:17:00 +0800 CST
view 77
2026年vLLM 0.18深度解析:PagedAttention显存管理、EAGLE3推测解码、连续批处理、分离式Prefill、FP4量化,附生产级部署代码与Benchmark对比
vLLM
LLM推理
PagedAttention
推测解码
EAGLE3
FP4量化
CUDA
GPU性能优化
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
编程
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
2026-05-03 15:13:07 +0800 CST
view 487
2026年深度解析vLLM核心架构,从PagedAttention进化到多节点分布式推理,涵盖SIG社区组织、v1架构重写、生产部署实战与性能优化全链路指南。
vLLM
PagedAttention
LLM
推理优化
分布式
Kubernetes
Python
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
6
7
8
9
10
...
54
下一页