程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
编程
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
2026-04-20 13:45:31 +0800 CST
view 317
深度对比vLLM与TensorRT-LLM两大LLM推理框架,从PagedAttention到Kernel Fusion,从量化技术到生产部署,助你做出正确的技术选型决策
LLM
vLLM
TensorRT-LLM
推理优化
大模型部署
量化技术
AI工程
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
编程
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
2026-05-22 06:19:51 +0800 CST
view 69
深入解析TensorRT-LLM推理框架,从Paged KV Cache、连续批处理到INT4/INT8/FP8量化实战,覆盖Blackwell架构适配、Triton部署与K8s生产方案
TensorRT-LLM
LLM推理
量化
INT4
Blackwell
GPU优化
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
编程
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
2026-04-30 14:21:13 +0800 CST
view 172
深度解析MCP 2026基准测试框架,拆解TensorRT-LLM、vLLM、Triton三大推理引擎的12个隐性耗时陷阱,提供可落地的诊断方法与修复路径。
AI推理
性能优化
TensorRT-LLM
vLLM
Triton
MCP2026
GPU优化
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 519
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
编程
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
2026-04-19 22:17:39 +0800 CST
view 422
深入解析Google LiteRT-LM端侧LLM推理引擎的核心架构:分层内存池、KV Cache量化、算子融合、WebGPU运行时。与TensorFlow Lite、llama.cpp、MLX横向对比,提供生产级部署实战指南。
Google
端侧AI
LiteRT-LM
WebGPU
量化
KV Cache
TensorFlow Lite
LLM推理
WebTransport 深度实战:HTTP/3 + QUIC 如何重新定义浏览器实时通信——从协议原理到生产级落地全链路解析
编程
WebTransport 深度实战:HTTP/3 + QUIC 如何重新定义浏览器实时通信——从协议原理到生产级落地全链路解析
2026-05-05 18:07:38 +0800 CST
view 131
WebTransport 基于 HTTP/3 和 QUIC 协议,从根本上解决了 WebSocket 的队头阻塞问题。本文从协议原理到生产部署,深入解析这项酝酿14年的浏览器实时通信新技术。
WebTransport
HTTP/3
QUIC
实时通信
浏览器
WebSocket
9Router 深度解析:开源路由器如何让 AI 编程成本归零,RTK 压缩省 40% Token
编程
9Router 深度解析:开源路由器如何让 AI 编程成本归零,RTK 压缩省 40% Token
2026-05-12 02:44:46 +0800 CST
view 304
深度解析9Router:RTK Token Saver压缩工具输出省20-40% token、Caveman Mode省65%输出token、三层自动降级Subscription→Cheap→Free、40+供应商100+模型、格式转换9种API格式、多账户轮询+OAuth自动刷新
9Router,AI路由器,RTK,Token压缩,ClaudeCode,Cursor,多模型路由,自动降级,KiroAI,免费AI编程,CavemanMode,OpenAI兼容
一套TypeScript代码,编译成macOS/iOS/Android全平台原生应用:Perry开源
编程
一套TypeScript代码,编译成macOS/iOS/Android全平台原生应用:Perry开源
2026-04-29 12:17:15 +0800 CST
view 655
Perry是基于Rust+SWC+LLVM的TypeScript原生编译器,将TS代码编译为macOS/iOS/Android/Linux/Windows/WebAssembly全平台原生二进制,无需Node.js、无需Electron,输出仅2-5MB。MIT开源。
TypeScript
跨平台开发
Rust
开源
原生应用
LLVM
SWC
Perry
YC总裁GStack深度解析:一人成军的AI工程革命,从提示词集合到虚拟工程团队的方法论跃迁
编程
YC总裁GStack深度解析:一人成军的AI工程革命,从提示词集合到虚拟工程团队的方法论跃迁
2026-05-11 17:56:21 +0800 CST
view 223
YC总裁Garry Tan开源的GStack,将Claude Code从通用AI助手变成一支虚拟工程团队:CEO、设计师、架构师、QA、安全官等23个专家角色。60天产出60万行生产代码,日均1万行。本文深度解析GStack技术架构、方法论和实战技巧。
GStack,Y Combinator,Garry Tan,Claude Code,AI编程,虚拟工程团队,斜杠命令,AI Agent
WeChatFerry 聊天 MCP 工具:让 AI 直接操控微信
编程
WeChatFerry 聊天 MCP 工具:让 AI 直接操控微信
2026-05-12 12:18:09 +0800 CST
view 152
基于WeChatFerry的聊天MCP工具,通过标准MCP协议让AI编程工具直接操控微信:发消息、管群聊、查通讯录、接收转账。支持Claude Code/Codex/VSCode等客户端,Go语言开发,仅Windows。
WeChatFerry
MCP
微信
Claude Code
Codex
StarRocks 深度实战:AI Agent 时代的统一数据查询底座——从架构原理到生产级多模态检索的完整指南
编程
StarRocks 深度实战:AI Agent 时代的统一数据查询底座——从架构原理到生产级多模态检索的完整指南
2026-05-21 20:54:59 +0800 CST
view 65
2026年AI Agent数据底座选型指南:深度解析StarRocks的统一多模态查询能力,从MPP架构原理到生产级向量检索+全文检索混合召回的完整实战。GitHub 11500+ Star的头部企业验证方案。
StarRocks,AI Agent,向量检索,湖仓一体,OLAP,数据库,RAG
DuckDB Quack 协议深度实战:从嵌入式分析到分布式多写者的架构进化
编程
DuckDB Quack 协议深度实战:从嵌入式分析到分布式多写者的架构进化
2026-05-22 06:50:01 +0800 CST
view 71
DuckDB Quack 协议让嵌入式分析数据库支持多并发写入的客户端-服务器模式,从协议架构、实战部署、性能调优到生产级高可用设计的完整指南
DuckDB
Quack
数据库
OLAP
Arrow
数据分析
CSS 2026 深度解析:8 大原生特性终结 JavaScript 依赖,前端开发范式正在重写
编程
CSS 2026 深度解析:8 大原生特性终结 JavaScript 依赖,前端开发范式正在重写
2026-05-15 11:18:21 +0800 CST
view 109
2026年CSS八大原生特性深度解析:锚点定位、视图过渡、滚动驱动动画、瀑布流、Subgrid、LCH颜色、离散属性动画、文本环绕平衡
CSS
前端
Anchor Positioning
View Transitions
滚动驱动动画
Subgrid
LCH颜色
Masonry
AI 编程助手 Token 烧钱太快?9Router + RTK 双剑合璧:从架构设计到生产级实践,节省 90% 成本完全指南
编程
AI 编程助手 Token 烧钱太快?9Router + RTK 双剑合璧:从架构设计到生产级实践,节省 90% 成本完全指南
2026-05-23 00:19:03 +0800 CST
view 38
深入剖析 9Router 智能模型路由和 RTK Token 压缩的技术原理、架构设计与生产级实践,帮助开发者节省高达 90% 的 AI 编程成本。
AI编程
Token优化
9Router
RTK
成本控制
9Router:三层降级路由+RTK Token压缩,让AI编程订阅永不中断
编程
9Router:三层降级路由+RTK Token压缩,让AI编程订阅永不中断
2026-05-12 20:20:40 +0800 CST
view 126
9Router把40+AI供应商、100+模型统一调度,三层降级路由确保开发不中断,RTK Token压缩平均节省20%-40%,GitHub连续多日登上Trending。npm一行命令安装,支持Claude Code/Codex/Cursor等所有主流AI编程工具。
9Router
AI路由
Token压缩
Claude Code
Codex
RTK
TEN Framework 深度解析:当实时多模态语音 AI 遇上真正的"即插即用"
编程
TEN Framework 深度解析:当实时多模态语音 AI 遇上真正的"即插即用"
2026-04-08 19:04:47 +0800 CST
view 313
TEN Framework 是一个开源的实时多模态对话 AI 框架,让开发者能够像搭积木一样快速构建低延迟、高质量的实时语音/视频 AI Agent。本文深度解析其核心架构、实战应用与性能优化策略。
TEN Framework
语音AI
实时多模态
WebRTC
AI Agent
CloakBrowser:4.3k Stars!开源浏览器反检测终极解决方案
案例
CloakBrowser:4.3k Stars!开源浏览器反检测终极解决方案
2026-05-11 08:20:25 +0800 CST
view 328
4300+ Stars 的开源项目 CloakBrowser,可能是目前最接近完美伪装的浏览器解决方案。通过 49 个 C++ 源码级补丁,从 Chromium 层面修改浏览器指纹,绕过 reCAPTCHA、Cloudflare、FingerprintJS 等反爬虫检测。仅需 3 行代码即可替换 Playwright。
CloakBrowser
反爬虫
浏览器指纹
绕过检测
Playwright
Chromium
WebRTC
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
编程
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
2026-04-21 08:46:51 +0800 CST
view 254
FFmpegFree:Vue3+TypeScript+Go+Wails跨平台桌面工具,支持音视频互转、RTMP/HLS推流、屏幕录制推流、FLV拉流播放、Office转PDF
开源
桌面应用
FFmpeg
音视频
Go
Vue3
Wails
流媒体
RTMP
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
编程
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
2024-11-19 08:26:56 +0800 CST
view 2207
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率。它提供简单易用的API,支持多种创意项目,如视频同步观看、嵌入式设备摄像头传输、数据安全传输等。Pion实现了完整的PeerConnectionAPI,支持多种媒体格式和加密算法,适用于多个操作系统和架构。示例代码展示了如何使用Pion发送视频文件到浏览器。
WebRTC
Golang
视频处理
网络通信
实时应用
Rust 1.95.0 深度解析:cfg_select!、闭包捕获优化、Trait 向上转型——2026 年最重要的 Rust 版本
编程
Rust 1.95.0 深度解析:cfg_select!、闭包捕获优化、Trait 向上转型——2026 年最重要的 Rust 版本
2026-05-14 03:43:00 +0800 CST
view 117
Rust 1.95.0深度解析:cfg_select!宏条件编译新语法、闭包捕获优化更精确的捕获模式减少Clone开销、Trait向上转型Supertrait Upcasting面向对象编程最后一公里、编译器增量编译速度提升20%。
Rust1.95,cfg_select,闭包捕获优化,Trait向上转型,SupertraitUpcasting,编译器优化
Linux 内核提权风暴:从 Copy Fail 到 Dirty Frag 再到 Fragnesia——零拷贝页缓存污染漏洞家族的终极解剖
编程
Linux 内核提权风暴:从 Copy Fail 到 Dirty Frag 再到 Fragnesia——零拷贝页缓存污染漏洞家族的终极解剖
2026-05-19 06:45:04 +0800 CST
view 158
深度解剖 2026 年三周内爆发的三个 Linux 内核高危提权漏洞:Copy Fail、Dirty Frag、Fragnesia,从内核源码层面分析零拷贝页缓存污染机制,给出检测、防护与修复的完整实战方案
Linux
内核安全
漏洞分析
提权
Dirty Frag
Copy Fail
Fragnesia
Docker 中运行并使用 WebRTC 的自托管虚拟浏览器
综合
Docker 中运行并使用 WebRTC 的自托管虚拟浏览器
2024-11-19 03:03:55 +0800 CST
view 1757
Neko虚拟浏览器是一款自托管的虚拟浏览器,允许用户在安全的虚拟环境中访问互联网。它支持多用户同时访问,适合开发人员和寻求隐私保护的用户。Neko提供了便捷的浏览体验,用户可以在多个设备上共享浏览器访问权限,适用于协作项目和资源共享。
虚拟浏览器
安全技术
WebRTC
Docker
隐私保护
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
编程
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
2026-05-03 15:13:07 +0800 CST
view 225
2026年深度解析vLLM核心架构,从PagedAttention进化到多节点分布式推理,涵盖SIG社区组织、v1架构重写、生产部署实战与性能优化全链路指南。
vLLM
PagedAttention
LLM
推理优化
分布式
Kubernetes
Python
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 295
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
21
下一页