程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
编程
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
2026-06-29 17:17:00 +0800 CST
view 80
2026年vLLM 0.18深度解析:PagedAttention显存管理、EAGLE3推测解码、连续批处理、分离式Prefill、FP4量化,附生产级部署代码与Benchmark对比
vLLM
LLM推理
PagedAttention
推测解码
EAGLE3
FP4量化
CUDA
GPU性能优化
Rolldown 深度解析:Vite 团队用 Rust 重写打包器的野心——从 Oxc 解析到 Rollup 兼容的完整技术内幕
编程
Rolldown 深度解析:Vite 团队用 Rust 重写打包器的野心——从 Oxc 解析到 Rollup 兼容的完整技术内幕
2026-05-18 07:13:14 +0800 CST
view 375
Rolldown 是 Vite 团队用 Rust 从零重写的下一代打包器,本文从架构设计、核心模块、代码实战到生产迁移,深度解析 Rolldown 的完整技术内幕。
Rolldown
Vite
Rust
前端构建
打包器
MemPalace 深度解析:当古希腊"记忆宫殿"成为AI长期记忆的工程解法
编程
MemPalace 深度解析:当古希腊"记忆宫殿"成为AI长期记忆的工程解法
2026-04-13 22:25:59 +0800 CST
view 491
MemPalace是一款本地AI记忆系统,基于古希腊记忆宫殿原理构建Wing/Hall/Room三级结构,Raw verbatim模式在LongMemEval上达到96.6% R@5,无摘要零LLM调用。本文深度解析其架构设计、存储管线与MCP集成。
AI记忆系统
向量数据库
ChromaDB
MCP协议
MemPalace
Claude Code Dynamic Workflows:多智能体协作编程的范式革命
编程
Claude Code Dynamic Workflows:多智能体协作编程的范式革命
2026-06-08 16:53:39 +0800 CST
view 242
深入解析Anthropic 2026年5月发布的Claude Code Dynamic Workflows:1000并行子智能体、对抗性验证、75万行代码11天迁移的生产级完全指南。
Claude
Anthropic
多智能体
AI编程
Dynamic Workflows
范式革命
OpenHarness:港大开源的AI Agent轻量级框架,1.1万行代码复刻Claude Code 98%核心能力
编程
OpenHarness:港大开源的AI Agent轻量级框架,1.1万行代码复刻Claude Code 98%核心能力
2026-04-08 13:36:32 +0800 CST
view 1322
OpenHarness是香港大学开源的AI Agent轻量级框架,用1.1万行Python代码实现了Claude Code 51.2万行代码98%的核心能力。本文深入解析其10大子系统架构、Agent Loop实现原理、与Claude Code的对比分析,以及如何快速上手构建自己的AI Agent。
AI Agent
开源项目
OpenHarness
Python
如何在 Linux 系统上安装字体
编程
如何在 Linux 系统上安装字体
2025-02-27 09:23:03 +0800 CST
view 2851
本文介绍了在不同Linux发行版(如Ubuntu、CentOS和ArchLinux)上安装和管理字体的方法,包括使用包管理器和手动安装字体的步骤。提供了具体的命令示例和字体文件的下载来源,以及如何使用Fontconfig管理字体。
Linux
字体管理
系统配置
Qdrant 2026 深度实战:当 Rust 遇上向量数据库——从 HNSW 算法到亿级向量检索、从内存优化到生产级 RAG 管道的完全指南
编程
Qdrant 2026 深度实战:当 Rust 遇上向量数据库——从 HNSW 算法到亿级向量检索、从内存优化到生产级 RAG 管道的完全指南
2026-06-22 05:29:50 +0800 CST
view 147
Qdrant 2026 深度实战指南,从 HNSW 算法原理到 Rust 存储引擎剖析,从生产级部署到 RAG 管道构建,15000 字完整教程。
Qdrant
向量数据库
Rust
AI
RAG
HNSW
PostgreSQL 18 深度解析:异步 I/O 破局、UUID v7 逆袭与索引跳跃扫描——开源数据库王的性能跃迁
编程
PostgreSQL 18 深度解析:异步 I/O 破局、UUID v7 逆袭与索引跳跃扫描——开源数据库王的性能跃迁
2026-05-10 18:50:25 +0800 CST
view 389
PostgreSQL 18带来异步I/O框架(3x性能提升)、UUID v7原生支持(12x查询加速)、索引跳跃扫描、虚拟生成列等重大更新。本文深度解析各特性原理、实战代码与性能数据。
PostgreSQL
数据库
异步IO
UUID
索引优化
Rust GUI 开发:打造美观高性能的跨平台应用
编程
Rust GUI 开发:打造美观高性能的跨平台应用
2024-11-18 22:20:49 +0800 CST
view 3091
RustGUI开发正在快速发展,提供高性能、安全和跨平台的桌面应用开发工具。本文探讨了Rust的GUI生态系统,包括Druid、iced和egui等框架的特点和示例代码,强调了Rust在内存安全、并发性能和跨平台支持方面的优势。尽管生态系统相对年轻,但其潜力巨大,适合个人开发者和企业级应用。
编程
软件开发
Rust
图形用户界面
跨平台应用
测试 FastAPI 应用程序:编写单元测试和集成测试
编程
测试 FastAPI 应用程序:编写单元测试和集成测试
2024-11-18 22:50:20 +0800 CST
view 1723
本文介绍了如何为FastAPI应用程序编写单元测试和集成测试,涵盖了测试环境的设置、单元测试和集成测试的编写,以及如何测试表单处理和JWT身份验证。通过使用pytest和httpx,读者可以确保应用程序的稳定性和功能的正确性。提供了实际的代码示例,帮助开发者理解测试的实现方式。
软件测试
FastAPI
Python编程
Bun 2026 深度实战:与 Node.js/Deno 全方位对比、性能基准与从零到生产部署的完整指南
编程
Bun 2026 深度实战:与 Node.js/Deno 全方位对比、性能基准与从零到生产部署的完整指南
2026-06-27 15:43:41 +0800 CST
view 175
2026年Bun深度实战指南:从Zig+JavaScriptCore架构原理、Bun vs Node.js vs Deno全方位性能对比,到环境搭建、核心API实战、内置工具链、TypeScript原生支持、Node.js迁移与生产部署,附完整代码示例和性能基准实测数据。
Bun
JavaScript
TypeScript
Node.js
Deno
性能优化
运行时
Zig
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
编程
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
2026-06-08 22:52:24 +0800 CST
view 299
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
编程
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
2026-06-08 22:53:03 +0800 CST
view 200
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
MemPalace 深度解析:当 AI 记忆系统终于学会「宫殿记忆法」
编程
MemPalace 深度解析:当 AI 记忆系统终于学会「宫殿记忆法」
2026-04-09 05:52:11 +0800 CST
view 1225
MemPalace 以 96.6% LongMemEval 召回率成为目前评分最高的 AI 记忆系统。本文深度解析其宫殿记忆法架构、四层记忆栈、AAAK 压缩方言,以及与 Claude Code 的集成方案。
AI
memory
vector-database
RAG
Claude
open-source
SGLang 深度解析:RadixAttention 如何重塑大模型推理的「结构化革命」
编程
SGLang 深度解析:RadixAttention 如何重塑大模型推理的「结构化革命」
2026-06-30 11:16:18 +0800 CST
view 61
深度解析 SGLang 大模型推理框架:RadixAttention 前缀缓存、零开销 CPU 调度器、结构化输出约束、推测解码、PD 分离等核心技术,对比 vLLM/TensorRT-LLM 选型,提供完整代码示例与生产级部署实践
SGLang
大模型推理
RadixAttention
前缀缓存
结构化输出
推测解码
PD分离
vLLM
TensorRT-LLM
SGLang 深度解析:RadixAttention 前缀缓存与结构化 LLM 推理革命——从 RAG/Agent 场景到生产级部署的完整指南
编程
SGLang 深度解析:RadixAttention 前缀缓存与结构化 LLM 推理革命——从 RAG/Agent 场景到生产级部署的完整指南
2026-06-30 11:17:15 +0800 CST
view 67
深度解析 SGLang 大模型推理框架:RadixAttention 前缀缓存、零开销 CPU 调度器、结构化输出约束、推测解码、PD 分离等核心技术,对比 vLLM/TensorRT-LLM 选型,提供完整代码示例与生产级部署实践
SGLang
大模型推理
RadixAttention
前缀缓存
结构化输出
推测解码
PD分离
vLLM
TensorRT-LLM
当编译器成为自动驾驶的最后一块拼图:MLIR 如何让特斯拉 FSD 反应快 20%
编程
当编译器成为自动驾驶的最后一块拼图:MLIR 如何让特斯拉 FSD 反应快 20%
2026-04-11 12:56:32 +0800 CST
view 514
从特斯拉 FSD V14.3 的 MLIR 重写出发,系统讲解多级中间表示(MLIR)编译器框架的核心原理、方言系统、以及在自动驾驶 AI 推理中的应用。
MLIR
编译器
特斯拉
FSD
自动驾驶
LLVM
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
编程
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
2026-06-12 18:19:08 +0800 CST
view 255
深度解析 Redis 之父 antirez 最新开源项目 ds4(DwarfStar):一个纯 C 语言手写的 DeepSeek V4 Flash 本地推理引擎。从「窄而深」的工程哲学、非对称 2-bit 量化、磁盘 KV 缓存、Metal/CUDA 内核优化到实际部署,完整拆解这个 13K+ Star 项目的技术内幕。
AI推理引擎
DeepSeek
本地推理
系统编程
开源项目
C语言
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
编程
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
2026-05-11 19:45:54 +0800 CST
view 463
GPT-5-Codex突破性引入Dynamic Thinking机制,简单任务节省93.7%token,复杂任务可自主工作7小时以上。深度解析核心技术架构与SWE-Bench表现,及其对开发者工作方式的根本性改变。
GPT-5-Codex
OpenAI
AI编程
Dynamic Thinking
Codex
SWE-Bench
自主编程
Agent
从MIT到SSPL:Deno 3.0如何用微内核架构向Node.js发起总攻
编程
从MIT到SSPL:Deno 3.0如何用微内核架构向Node.js发起总攻
2026-05-12 00:43:53 +0800 CST
view 402
深度解析Deno3.0五大核心变革:微内核+可插拔模块架构、动态权限沙箱与microVM隔离、WASM优先插件生态、io_uring与V8深度优化带来的3倍性能提升,以及MIT转SSPL许可证争议对开发者的真实影响,附Node.js迁移实战指南
Deno,Node.js,TypeScript,RyanDahl,SSPL,微内核,权限沙箱,WASM,io_uring,V8引擎,JavaScript运行时,开源许可证
Python 3.13 深度实战:自由线程(No-GIL)、JIT 编译器与异步 IO 的工程化完全指南(2026)
编程
Python 3.13 深度实战:自由线程(No-GIL)、JIT 编译器与异步 IO 的工程化完全指南(2026)
2026-06-04 16:42:14 +0800 CST
view 331
Python 3.13深度解析:自由线程No-GIL模式、JIT编译器原理与实战、交互式解释器改进、类型系统新特性,附完整生产迁移指南
Python
Python3.13
No-GIL
JIT编译器
自由线程
Go 1.26 深度解析:new 语法升级、Green Tea GC 默认开启、Goroutine 泄漏检测——Go 语言 2026 年最重要的版本
编程
Go 1.26 深度解析:new 语法升级、Green Tea GC 默认开启、Goroutine 泄漏检测——Go 语言 2026 年最重要的版本
2026-05-15 09:47:19 +0800 CST
view 444
Go 1.26 于2026年2月发布,带来new表达式语法升级、Green Tea GC默认开启、goroutine泄漏检测、cgo性能提升30%、crypto/tls默认后量子保护等重大更新。
Go
Golang
Green Tea GC
goroutine泄漏检测
cgo性能
Rust 冲上 TIOBE 第12位:从最受喜爱到改变行业的技术深度解析——基金会维护者基金、Roto 一周年、Zstandard 原生实现与 gRPC-Rust 路线图全景(2026)
编程
Rust 冲上 TIOBE 第12位:从最受喜爱到改变行业的技术深度解析——基金会维护者基金、Roto 一周年、Zstandard 原生实现与 gRPC-Rust 路线图全景(2026)
2026-06-15 23:23:39 +0800 CST
view 253
2026年6月 Rust 冲上 TIOBE 历史新高第12位,本文深度解析 Rust 生态最新动态:基金会维护者基金、Roto 一周年、Zstandard 原生实现、gRPC-Rust 路线图,从技术原理到生产实践全面解读。
Rust
TIOBE
Roto
Zstandard
gRPC
编程语言
TypeScript 6.0深度解析:JS终章与Go重写序章——2026升级完全指南
编程
TypeScript 6.0深度解析:JS终章与Go重写序章——2026升级完全指南
2026-04-11 12:08:14 +0800 CST
view 1213
深度解析TypeScript 6.0发布:作为JS实现的最后一个大版本,它为Go重写的TS7铺路。本文涵盖配置默认值变更、新语法特性、破坏性更新清单、性能提升分析,以及从TS5.x到TS6的实战升级路线图。
TypeScript
JavaScript
TypeScript6
TypeScript7
Go
前端
编程语言
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
93
94
95
96
97
...
145
下一页