程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
编程
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
2026-06-02 21:19:20 +0800 CST
view 912
Headroom 是专为 LLM 设计的通用压缩层,以 Library、Proxy、MCP Server 三种形态存在,在信息不丢失的前提下把 Token 消耗砍掉 60-95%。本文从信息论底层原理讲起,完整拆解四层压缩管线,结合真实代码实战演示接入方式。
LLM
Token优化
GitHub Trending
Python
RAG
Mojo 深度解析:为 AI 基础而生的下一代系统编程语言——比 Python 快 68000 倍的秘密
编程
Mojo 深度解析:为 AI 基础而生的下一代系统编程语言——比 Python 快 68000 倍的秘密
2026-05-01 09:34:12 +0800 CST
view 328
深度解析 Mojo 语言:基于 MLIR 的 AI 基础设施编程语言,比 Python 快 68000 倍的秘密,从架构设计、编译原理、性能优化到代码实战的完整拆解
Mojo
AI
编译器
性能优化
MLIR
ECC 深度实战:当 AI 编程助手学会「自我优化」——从 Skills 到 MCP 的生产级 Agent 性能调优完全指南(2026)
编程
ECC 深度实战:当 AI 编程助手学会「自我优化」——从 Skills 到 MCP 的生产级 Agent 性能调优完全指南(2026)
2026-06-11 13:23:32 +0800 CST
view 66
ECC 是一个为 AI Agent Harness 设计的性能优化系统,源自 Anthropic 黑客松冠军项目,GitHub 20 万 Star。本文深入剖析其 Skills、Agents、Hooks、MCP 架构,提供从零到生产级的完整实战指南。
AI编程
Claude Code
Cursor
开源
性能优化
ECC
9个高级前端必会的性能优化 API,你掌握了几个?
编程
9个高级前端必会的性能优化 API,你掌握了几个?
2025-07-14 12:35:24 +0800 CST
view 1143
本文介绍了9个高级前端性能优化API,包括requestIdleCallback、IntersectionObserver、WeakMap等,详细阐述了它们的适用场景和代码示例。这些API可以显著提升页面性能和用户体验,帮助开发者写出更现代的前端代码。
前端开发
性能优化
Web技术
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 246
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 219
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
PostgreSQL 18 → 19 深度实战:当世界上最先进的开源数据库迎来 30 岁——从异步 I/O 引擎到智能图查询,2026 生产级完全指南
编程
PostgreSQL 18 → 19 深度实战:当世界上最先进的开源数据库迎来 30 岁——从异步 I/O 引擎到智能图查询,2026 生产级完全指南
2026-06-11 14:48:47 +0800 CST
view 46
深度解析 PostgreSQL 18 异步I/O、跳过扫描、UUIDv7 等核心新特性,前瞻 PG19 Beta 的 REPACK、64位 MultiXact、ON CONFLICT DO SELECT 等关键改进,附完整性能优化实战案例和生产级配置指南。
PostgreSQL
数据库
性能优化
PostgreSQL 18
PostgreSQL 19
AIO
SQL
千万级数据的全表更新的正确方式
编程
千万级数据的全表更新的正确方式
2024-11-19 01:43:51 +0800 CST
view 1799
在处理千万级数据的全表更新时,直接执行SQL会导致主库负载剧增,影响主从同步性能。通过分批处理和索引优化,可以有效减少对数据库的压力。使用`SQL_NO_CACHE`避免缓存影响,强制使用主键索引,并按主键顺序更新数据,从而提高效率,确保数据库正常运行。
数据库
性能
优化
MySQL
数据处理
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
编程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
2026-06-11 15:20:19 +0800 CST
view 86
Netflix工程师开源的AI上下文压缩工具Headroom,能在保持答案质量的前提下将Token消耗压缩60-95%,累计节省70万美元成本。本文深度剖析其架构设计、CCR可逆机制、跨Agent记忆共享与生产级集成实践。
AI编程
Token压缩
上下文管理
LLM优化
OpenSource
编程
TIME_WAIT状态的连接过多导致系统端口资源耗尽问题
2024-11-17 21:27:27 +0800 CST
view 3303
本文讨论了如何优化Linux系统中的TIME_WAIT状态,使用netstat命令查看TCP连接状态,并通过修改/etc/sysctl.conf文件中的相关参数来减少TIME_WAIT套接字的数量。具体参数包括开启SYNCookies、重用TIME-WAITsockets、快速回收TIME-WAITsockets等,最后通过执行/sysctl-p命令使修改生效。
Linux
网络优化
TCP配置
Vue中的异步更新是如何实现的?
编程
Vue中的异步更新是如何实现的?
2024-11-18 19:24:29 +0800 CST
view 1233
在Vue.js中,异步更新机制是其响应式系统的核心。Vue利用JavaScript的事件循环和虚拟DOM技术,将数据变化推迟到下一个事件循环周期进行统一处理,从而避免频繁的DOM更新,提升性能。示例代码展示了如何通过按钮点击触发异步更新,2秒后更新消息,体现了Vue的异步更新特性。
前端开发
Vue.js
性能优化
WindowsReactor 深度实战:当微软用 Rust 重写 Windows 11——从内存安全到原生应用性能飙升的生产级完全指南(2026)
编程
WindowsReactor 深度实战:当微软用 Rust 重写 Windows 11——从内存安全到原生应用性能飙升的生产级完全指南(2026)
2026-06-11 15:53:20 +0800 CST
view 49
深度解析微软用 Rust 重写 Windows 11 原生应用的技术内核,从所有权系统到 WindowsReactor 架构,从性能剖析到代码实战,带你理解 Rust 如何在桌面应用领域掀起性能革命。
Rust
Windows
WinUI
性能优化
系统编程
桌面开发
微软
内存安全
Open Notebook 深度实战:当开源替代方案击败 Google Notebook LM——从多模态RAG到自托管部署的生产级完全指南(2026)【下】
编程
Open Notebook 深度实战:当开源替代方案击败 Google Notebook LM——从多模态RAG到自托管部署的生产级完全指南(2026)【下】
2026-06-11 16:21:26 +0800 CST
view 57
Open Notebook 是 Google Notebook LM 的开源替代方案。本文下篇深入实战多模型集成、播客生成、性能调优与安全管控,附真实生产案例。
Open Notebook
Notebook LM 替代品
多模型集成
播客生成
性能优化
生产案例
Python 3.14 深度解析:从模板字符串到多解释器并发——Python 历史上最激进的版本进化
编程
Python 3.14 深度解析:从模板字符串到多解释器并发——Python 历史上最激进的版本进化
2026-05-17 07:42:30 +0800 CST
view 243
Python 3.14 全面解析:延迟注解求值、模板字符串t-string、标准库多解释器并发、自由线程正式支持、零开销远程调试、Zstandard压缩、尾调用解释器等重量级特性
Python
PEP
性能优化
SkyPilot 深度实战:从多云 AI 调度到成本优化的企业级完全指南
编程
SkyPilot 深度实战:从多云 AI 调度到成本优化的企业级完全指南
2026-05-24 00:00:53 +0800 CST
view 217
2026 年,SkyPilot 作为 AI 工作负载的通用编排层,彻底解决了多云 GPU 资源调度的碎片化问题。本文深入剖析其架构设计与生产级最佳实践。
SkyPilot
AI基础设施
多云调度
成本优化
GPU
综合
robots.txt 的写法及用法
2024-11-19 01:44:21 +0800 CST
view 1602
本文介绍了robots.txt文件的定义、语法及其在搜索引擎优化中的作用。robots.txt是一个协议,用于指示搜索引擎哪些内容可以被抓取,哪些内容应被禁止。文中提供了多种使用示例和注意事项,强调了合理使用该文件的重要性,以避免误区和提高网站的访问效率。
搜索引擎优化
网站管理
网络协议
robots
MySQL 9.0 vs MariaDB 12:开源数据库的终局博弈——从协议之变到云原生架构的生产级选型完全指南(2026)
编程
MySQL 9.0 vs MariaDB 12:开源数据库的终局博弈——从协议之变到云原生架构的生产级选型完全指南(2026)
2026-06-12 13:18:06 +0800 CST
view 32
深度对比 MySQL 9.0 与 MariaDB 12,从协议演变、性能架构、开发者体验、迁移成本、生产实战等多维度解析,帮助技术决策者做出正确的数据库选型。
MySQL
MariaDB
数据库
开源
云原生
性能优化
aiohere是一个用于处理异步IO操作的Python库
综合
aiohere是一个用于处理异步IO操作的Python库
2024-11-18 11:00:26 +0800 CST
view 1493
aiohere是一个用于处理异步IO操作的Python库,能显著提升网络请求和IO密集型任务的性能。本文介绍了aiohere的安装、基本用法、高级用法及实际案例,包括并发处理和超时设置,帮助开发者高效处理多个请求并获取API数据。掌握aiohere将有助于提升Python异步编程的效率。
Python库
异步编程
网络编程
性能优化
API交互
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 322
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
编程
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
2026-06-12 14:20:52 +0800 CST
view 31
深度解析 ICML 2026 接收的 CLEAR 推理优化方法。浙江大学、腾讯、北京大学联合提出:对没有希望的问题理性放弃,把算力集中到能解决的问题上。包含完整 Python 实现、vLLM/SGLang 集成、生产级部署指南。
LLM
推理优化
ICML 2026
CLEAR
算力分配
编程
Bun.jsv1.1.25版本发布,性能显著提升,每秒可处理129万个HTTP请求
2024-11-18 03:36:05 +0800 CST
view 2061
Bun.jsv1.1.25版本发布,性能显著提升,每秒可处理129万个HTTP请求。新增对node:cluster的支持,允许在同一端口上运行多个worker以提高吞吐量。支持V8公开C++API,修复了S3上传速度的bug,提升了5倍。还增加了对Worker的支持,改进了Node.js兼容性,并修复了TCP连接的bug。
JavaScript
性能优化
后端开发
Web开发
开源
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
编程
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
2026-05-02 08:05:40 +0800 CST
view 513
深度拆解 GitHub Trending 开源项目 Context-Mode:通过沙箱隔离、会话连续性、代码思维和输出压缩四维度,实现 AI 编程代理上下文窗口 98% 压缩,支持 14 个平台
AI编程
上下文优化
MCP
Context-Mode
AI Agent
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 277
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
编程
php在使用JQuery.lazyload图片懒加载时,正则替换Img的src为original
2024-11-17 18:13:34 +0800 CST
view 3841
在页面有很多大图时,为了提升用户体验和减轻服务器压力,通常会使用图片懒加载技术。使用lazyload时,需要将图片的src值设置为占位符,并将真实路径赋给original,以确保jquery.lazyload正常执行。示例代码展示了如何替换图片标签的src属性,并使用jquery.lazyload实现懒加载效果。
前端开发
性能优化
技术实现
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
7
8
9
10
11
...
22
下一页