程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Deno 2.0 深度实战:Node.js之父的理想主义如何在2026年真正落地
编程
Deno 2.0 深度实战:Node.js之父的理想主义如何在2026年真正落地
2026-05-23 08:23:05 +0800 CST
view 16
Deno 2.0正式发布,带来完整的npm兼容性、package.json支持和稳定的API。本文从环境配置、安全权限系统、TypeScript原生支持、内置工具链、Deno KV嵌入式数据库、Deno Deploy边缘部署等维度,深度解析这一Node.js之父的野心之作,并与Bun、Node.js 26进行实战性能对比。
Deno
TypeScript
Node.js
Bun
后端开发
边缘计算
JavaScript运行时
KV数据库
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 98
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 97
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
编程
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
2026-04-19 22:17:39 +0800 CST
view 410
深入解析Google LiteRT-LM端侧LLM推理引擎的核心架构:分层内存池、KV Cache量化、算子融合、WebGPU运行时。与TensorFlow Lite、llama.cpp、MLX横向对比,提供生产级部署实战指南。
Google
端侧AI
LiteRT-LM
WebGPU
量化
KV Cache
TensorFlow Lite
LLM推理
TurboQuant + RWKV-6:AI 推理效率双重突破——从内存压缩到线性架构,大模型部署范式的革命性重构
编程
TurboQuant + RWKV-6:AI 推理效率双重突破——从内存压缩到线性架构,大模型部署范式的革命性重构
2026-04-20 10:46:48 +0800 CST
view 220
深度解析 2026 年 AI 推理效率的双重突破:Google TurboQuant 实现 6 倍内存压缩与 8 倍速度提升,RWKV-6 以线性复杂度架构打破 Transformer 的二次方魔咒。从数学原理到代码实战,详解这场效率革命的本质。
TurboQuant
RWKV
AI推理
内存压缩
大模型
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 161
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
AI Agent 沙箱三国杀:OpenSandbox vs CubeSandbox vs E2B,从内核隔离到秒级调度的全链路技术拆解
编程
AI Agent 沙箱三国杀:OpenSandbox vs CubeSandbox vs E2B,从内核隔离到秒级调度的全链路技术拆解
2026-05-02 06:06:14 +0800 CST
view 333
深度拆解阿里OpenSandbox、腾讯CubeSandbox与E2B三大AI Agent沙箱方案,从内核隔离原理、API协议设计、调度架构、性能实测到生产部署全链路技术分析
OpenSandbox
CubeSandbox
E2B
AI Agent
沙箱
KVM
Docker
Kubernetes
eBPF
RustVMM
forkd 深度解析:101ms 内 fork microVM 沙箱——Rust + Firecracker 如何重新定义 AI Agent 的算力分配
编程
forkd 深度解析:101ms 内 fork microVM 沙箱——Rust + Firecracker 如何重新定义 AI Agent 的算力分配
2026-05-17 13:46:14 +0800 CST
view 83
深入解析forkd:如何用Rust + Firecracker实现101ms内创建100个KVM隔离沙箱,AI Agent算力分配的新范式。
Rust
Firecracker
microVM
Sandbox
KVM
Copy-on-Write
Snapshot
River-LLM 深度解析:上交大如何让大模型推理速度翻倍,却几乎不损失精度
编程
River-LLM 深度解析:上交大如何让大模型推理速度翻倍,却几乎不损失精度
2026-05-02 19:05:49 +0800 CST
view 125
深入解析上海交通大学 River-LLM 框架:通过退出层与骨干层共享 KV 缓存,解决早期退出的缓存缺失难题,实现 1.71x-2.16x 推理加速,几乎不损失精度。
LLM
推理优化
KV缓存
早期退出
量化
上海交通大学
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
编程
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
2026-04-17 10:15:58 +0800 CST
view 316
2026年4月,MIT、英伟达、浙江大学联合发布TriAttention,用三角函数建模注意力距离偏好,实现KV缓存10.7倍压缩,让单卡4090跑出百万Token上下文。
AI
大模型
Transformer
注意力机制
KV缓存
长上下文
模型优化
论文解读
2026
oMLX 深度解析:Apple Silicon 原生的本地大模型推理服务器——从分层 KV 缓存到菜单栏级 AI 编码伴侣
编程
oMLX 深度解析:Apple Silicon 原生的本地大模型推理服务器——从分层 KV 缓存到菜单栏级 AI 编码伴侣
2026-05-21 22:30:11 +0800 CST
view 39
深入解析 oMLX 的分层 KV 缓存架构(热 RAM + 冷 SSD)、Copy-on-Write 优化、与 Claude Code 的深度集成,以及 Apple Silicon 原生的推理性能优化。
oMLX
Apple Silicon
本地大模型
KV缓存
MLX
推理服务器
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
编程
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
2026-04-18 12:45:10 +0800 CST
view 348
深度解析MIT/NVIDIA/浙大联合发布的TriAttention技术,用三角函数预测注意力分布,实现KV Cache智能压缩,让超长上下文推理成为可能
大模型
注意力机制
KV缓存
Transformer
深度学习
AI优化
达梦图数据库 V4.0 深度实战:图原生+向量深度融合,千亿级数据让AI真正"懂业务"
编程
达梦图数据库 V4.0 深度实战:图原生+向量深度融合,千亿级数据让AI真正"懂业务"
2026-05-16 13:15:18 +0800 CST
view 105
2026年4月,达梦数据发布图数据库V4.0,实现图原生与向量数据库的深度融合理念。本文深度解析其架构设计、三大AI增强能力和千亿级性能优化实践。
数据库
图数据库
向量数据库
AI
达梦
达梦GDMBASE V4.0揭秘:千亿级图数据库与向量数据库的"原生融合"架构革命
编程
达梦GDMBASE V4.0揭秘:千亿级图数据库与向量数据库的"原生融合"架构革命
2026-05-16 13:15:41 +0800 CST
view 109
2026年4月,达梦数据发布图数据库V4.0,实现图原生与向量数据库的深度融合理念。本文深度解析其架构设计、三大AI增强能力和千亿级性能优化实践。
数据库
图数据库
向量数据库
AI
达梦
Redis 8.0 深度解析:30项性能飞跃、8种新数据结构与重回开源的破局之路
编程
Redis 8.0 深度解析:30项性能飞跃、8种新数据结构与重回开源的破局之路
2026-05-12 18:40:32 +0800 CST
view 94
深度解析Redis 8.0最新版本核心变化:命令延迟降低87%、吞吐量提升112%、新增8种数据结构(向量集/JSON/时序/概率结构)、重回BSD开源、I/O线程重构、Query Engine提升16倍。含架构解析与代码实战。
Redis8,Redis新版本,向量数据库,JSON数据结构,内存数据库,性能优化,开源
PostgreSQL 18 深度实战:从 I/O 子系统重构到 AI 原生向量数据库——新一代开源关系型数据库的架构完全指南
编程
PostgreSQL 18 深度实战:从 I/O 子系统重构到 AI 原生向量数据库——新一代开源关系型数据库的架构完全指南
2026-05-23 15:16:30 +0800 CST
view 2
深入剖析 PostgreSQL 18 的核心新特性:I/O 子系统重构带来 3 倍性能提升、Skip Scan 彻底解决索引设计痛点、虚拟生成列优化存储、OAuth 2.0 企业级 SSO 集成、pgvector 向量检索深度融合。从架构设计到生产实战,完整指南。
PostgreSQL
数据库
性能优化
AI原生
向量数据库
达梦数据库 DM9 深度解析:国产数据库的「集中分布一体化」革命——从 450 项新特性到 AI 原生架构的全链路技术拆解
编程
达梦数据库 DM9 深度解析:国产数据库的「集中分布一体化」革命——从 450 项新特性到 AI 原生架构的全链路技术拆解
2026-05-02 17:07:56 +0800 CST
view 175
深度解析达梦数据库 DM9 的技术架构:集中分布一体化设计、450 项新特性、AI 原生能力、向量检索、多租户架构,以及金融核心系统迁移实战案例。
数据库
达梦
DM9
国产数据库
AI
PostgreSQL 18 深度解析:全新 I/O 子系统如何让数据库性能提升3倍——从存储架构革命到向量检索原生支持的工程全解
编程
PostgreSQL 18 深度解析:全新 I/O 子系统如何让数据库性能提升3倍——从存储架构革命到向量检索原生支持的工程全解
2026-04-13 17:56:18 +0800 CST
view 280
PostgreSQL 18 深度解析:全新 I/O 子系统(io_uring)带来高达3倍读取性能提升,虚拟生成列、uuidv7()、OAuth 2.0认证、原生向量检索支持,工程化全解与生产部署最佳实践。
PostgreSQL
数据库
性能优化
io_uring
向量数据库
阿里巴巴 zvec 深度解析:让向量搜索回归进程内的极致性能之道
编程
阿里巴巴 zvec 深度解析:让向量搜索回归进程内的极致性能之道
2026-04-23 05:10:48 +0800 CST
view 285
深度解析阿里巴巴开源的轻量级进程内向量数据库zvec,从Proxima引擎架构、RabitQ量化算法、HNSW索引优化、WAL持久化到SIMD自动分发,含完整Python/Node.js代码实战与性能对比
zvec
向量数据库
Proxima
RabitQ
HNSW
嵌入式数据库
AI
向量检索
PostgreSQL pgvectorscale 深度解析:当 DiskANN 磁盘索引遇上 AI 原生数据库——千万级向量检索的工程革命
编程
PostgreSQL pgvectorscale 深度解析:当 DiskANN 磁盘索引遇上 AI 原生数据库——千万级向量检索的工程革命
2026-04-15 06:52:46 +0800 CST
view 308
深度解析 pgvectorscale 扩展的 StreamingDiskANN 磁盘索引、统计二进制量化(SBQ)和标签过滤搜索三大核心技术,手把手搭建生产级 RAG 向量检索系统
PostgreSQL
pgvectorscale
DiskANN
向量检索
AI 数据库
RAG
SBQ
云数据库
阿里巴巴 ZVec 深度解析:用 C++ 打造进程内向量数据库,为什么说它是向量界的 SQLite?
编程
阿里巴巴 ZVec 深度解析:用 C++ 打造进程内向量数据库,为什么说它是向量界的 SQLite?
2026-04-24 01:13:36 +0800 CST
view 182
阿里巴巴开源的进程内向量数据库 ZVec 深度解析:从架构设计、WAL存储引擎、HNSW/RabitQ索引到RAG实战,对比Chroma/FAISS/Milvus,为什么说它是向量界的SQLite?
ZVec
向量数据库
C++
RabitQ
HNSW
进程内数据库
RAG
ZVec 深度实战:阿里巴巴开源的轻量级向量数据库——从进程内架构到 AI 应用集成的全链路解析
编程
ZVec 深度实战:阿里巴巴开源的轻量级向量数据库——从进程内架构到 AI 应用集成的全链路解析
2026-05-07 08:06:52 +0800 CST
view 181
深度解析阿里巴巴开源的 ZVec 轻量级向量数据库,从进程内架构设计、HNSW 索引原理到 RAG 应用实战,全面掌握向量检索系统的设计与优化
zvec
向量数据库
AI
RAG
嵌入式数据库
zvec 深度实战:阿里巴巴 3.5K Star 的轻量级向量数据库——从进程内架构到 RAG 生产部署的全链路解析
编程
zvec 深度实战:阿里巴巴 3.5K Star 的轻量级向量数据库——从进程内架构到 RAG 生产部署的全链路解析
2026-05-07 08:07:07 +0800 CST
view 139
深度解析阿里巴巴开源的 ZVec 轻量级向量数据库,从进程内架构设计、HNSW 索引原理到 RAG 应用实战,全面掌握向量检索系统的设计与优化
zvec
向量数据库
AI
RAG
嵌入式数据库
在MySQL中全局回滚一张表数据的多种方法,包括使用事务、备份与恢复、触发器和二进制日志
编程
在MySQL中全局回滚一张表数据的多种方法,包括使用事务、备份与恢复、触发器和二进制日志
2024-11-18 13:59:43 +0800 CST
view 1450
本文探讨了在MySQL中全局回滚一张表数据的多种方法,包括使用事务、备份与恢复、触发器和二进制日志。通过具体的代码示例,详细介绍了如何管理事务、进行数据备份与恢复、创建触发器记录数据变化,以及解析二进制日志进行数据回滚。提供了实践建议,以帮助数据库管理员和开发人员有效应对数据操作错误,确保数据安全性和一致性。
数据库
数据管理
MySQL
数据恢复
编程
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
16
下一页