程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
PostgreSQL pgvectorscale 深度解析:当 DiskANN 磁盘索引遇上 AI 原生数据库——千万级向量检索的工程革命
编程
PostgreSQL pgvectorscale 深度解析:当 DiskANN 磁盘索引遇上 AI 原生数据库——千万级向量检索的工程革命
2026-04-15 06:52:46 +0800 CST
view 337
深度解析 pgvectorscale 扩展的 StreamingDiskANN 磁盘索引、统计二进制量化(SBQ)和标签过滤搜索三大核心技术,手把手搭建生产级 RAG 向量检索系统
PostgreSQL
pgvectorscale
DiskANN
向量检索
AI 数据库
RAG
SBQ
云数据库
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 206
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 186
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Vite 6 深度解析:构建工具的新里程碑,如何让前端开发快上加快
编程
Vite 6 深度解析:构建工具的新里程碑,如何让前端开发快上加快
2026-05-12 02:18:40 +0800 CST
view 174
深度解析Vite 6的核心架构升级:Environment API实现浏览器/SSR/Edge Workers多环境统一构建、依赖预构建并行化让冷启动缩短40%、模块级HMR让热更新延迟低于10ms、Rollup 4集成提升生产构建速度29%、完整迁移指南与破坏性变更详解
Vite6,前端构建工具,Environment API,HMR,热更新,Rollup4,esbuild,性能优化,迁移指南,React,Vue,Svelte
ThingsBoard 21.1K Star 深度解析:物联网平台天花板如何让设备管理像搭积木一样简单
编程
ThingsBoard 21.1K Star 深度解析:物联网平台天花板如何让设备管理像搭积木一样简单
2026-04-16 08:57:18 +0800 CST
view 324
深度解析21.1K Star开源物联网平台ThingsBoard,了解它如何让设备管理变得像搭积木一样简单,涵盖架构设计、规则引擎、仪表盘、多租户等核心功能。
ThingsBoard
物联网
IoT平台
开源
设备管理
智能家居
智慧工厂
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调