程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
编程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
2026-06-11 15:20:19 +0800 CST
view 112
Netflix工程师开源的AI上下文压缩工具Headroom,能在保持答案质量的前提下将Token消耗压缩60-95%,累计节省70万美元成本。本文深度剖析其架构设计、CCR可逆机制、跨Agent记忆共享与生产级集成实践。
AI编程
Token压缩
上下文管理
LLM优化
OpenSource
编程
TIME_WAIT状态的连接过多导致系统端口资源耗尽问题
2024-11-17 21:27:27 +0800 CST
view 3303
本文讨论了如何优化Linux系统中的TIME_WAIT状态,使用netstat命令查看TCP连接状态,并通过修改/etc/sysctl.conf文件中的相关参数来减少TIME_WAIT套接字的数量。具体参数包括开启SYNCookies、重用TIME-WAITsockets、快速回收TIME-WAITsockets等,最后通过执行/sysctl-p命令使修改生效。
Linux
网络优化
TCP配置
SkyPilot 深度实战:从多云 AI 调度到成本优化的企业级完全指南
编程
SkyPilot 深度实战:从多云 AI 调度到成本优化的企业级完全指南
2026-05-24 00:00:53 +0800 CST
view 222
2026 年,SkyPilot 作为 AI 工作负载的通用编排层,彻底解决了多云 GPU 资源调度的碎片化问题。本文深入剖析其架构设计与生产级最佳实践。
SkyPilot
AI基础设施
多云调度
成本优化
GPU
综合
robots.txt 的写法及用法
2024-11-19 01:44:21 +0800 CST
view 1604
本文介绍了robots.txt文件的定义、语法及其在搜索引擎优化中的作用。robots.txt是一个协议,用于指示搜索引擎哪些内容可以被抓取,哪些内容应被禁止。文中提供了多种使用示例和注意事项,强调了合理使用该文件的重要性,以避免误区和提高网站的访问效率。
搜索引擎优化
网站管理
网络协议
robots
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 322
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
编程
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
2026-06-12 14:20:52 +0800 CST
view 41
深度解析 ICML 2026 接收的 CLEAR 推理优化方法。浙江大学、腾讯、北京大学联合提出:对没有希望的问题理性放弃,把算力集中到能解决的问题上。包含完整 Python 实现、vLLM/SGLang 集成、生产级部署指南。
LLM
推理优化
ICML 2026
CLEAR
算力分配
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
编程
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
2026-05-02 08:05:40 +0800 CST
view 518
深度拆解 GitHub Trending 开源项目 Context-Mode:通过沙箱隔离、会话连续性、代码思维和输出压缩四维度,实现 AI 编程代理上下文窗口 98% 压缩,支持 14 个平台
AI编程
上下文优化
MCP
Context-Mode
AI Agent
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 280
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
编程
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
2026-04-21 05:16:09 +0800 CST
view 533
深入剖析 DeepSeek 开源的 DeepGEMM 库:从 FP8 精度革命到 1550 TFLOPS 性能突破,揭秘现代 AI 推理基础设施的底层优化技术
DeepGEMM
FP8
DeepSeek
CUDA
AI推理
GPU优化
GEMM
TensorCore
Python上下文管理器:with语句
编程
Python上下文管理器:with语句
2024-11-19 06:25:31 +0800 CST
view 1591
本文深入探讨了Python中的上下文管理器及其与with语句的结合使用,展示了如何通过上下文管理器优雅地管理资源,包括文件操作、数据库连接和自定义计时器等。还介绍了contextlib模块的使用以及异步上下文管理器的创建,强调了上下文管理器在异常处理和资源管理中的重要性。
Python编程
资源管理
异常处理
数据库
异步编程
代码优化
让AI编程成本暴降98%:context-mode MCP插件深度解析与实战指南
编程
让AI编程成本暴降98%:context-mode MCP插件深度解析与实战指南
2026-06-12 19:18:37 +0800 CST
view 45
深度解析context-mode如何通过智能上下文压缩让AI编程成本降低98%
AI编程
MCP协议
成本优化
上下文管理
River-LLM 深度解析:上交大如何让大模型推理速度翻倍,却几乎不损失精度
编程
River-LLM 深度解析:上交大如何让大模型推理速度翻倍,却几乎不损失精度
2026-05-02 19:05:49 +0800 CST
view 245
深入解析上海交通大学 River-LLM 框架:通过退出层与骨干层共享 KV 缓存,解决早期退出的缓存缺失难题,实现 1.71x-2.16x 推理加速,几乎不损失精度。
LLM
推理优化
KV缓存
早期退出
量化
上海交通大学
EnsembleParticleSwarmOptimization(EPSO)是一个用于粒子群优化的Python库
综合
EnsembleParticleSwarmOptimization(EPSO)是一个用于粒子群优化的Python库
2024-11-18 15:03:40 +0800 CST
view 1389
EnsembleParticleSwarmOptimization(EPSO)是一个用于粒子群优化的Python库,提供简单高效的实现。本文介绍了EPSO的安装、基本用法和高级用法,并通过最小化Rastrigin函数的实际案例展示其功能。EPSO允许用户自定义粒子群大小、迭代次数及加速系数,适用于各种优化问题,具有灵活的接口和丰富的参数配置选项。
数据科学
算法
优化
Python库
5 种替代 if-else 的实用 JavaScript 优化技巧,让代码更简洁可维护
编程
5 种替代 if-else 的实用 JavaScript 优化技巧,让代码更简洁可维护
2025-08-15 12:32:53 +0800 CST
view 1072
本文总结了5种替代if-else的JavaScript优化技巧,包括三元运算符、对象字面量映射、策略模式、短路运算符和规则数组。这些技巧旨在提升代码的简洁性和可维护性,帮助开发者在复杂逻辑中保持代码清晰和易读。
编程
JavaScript
代码优化
软件开发
技术技巧
前端代码规范 - 图片相关
编程
前端代码规范 - 图片相关
2024-11-19 08:34:48 +0800 CST
view 1353
本文详细介绍了前端项目中图片的使用规范,包括图片格式选择、尺寸与压缩、图标使用、响应式图片、懒加载、缓存、合理使用、组件化优化、CDN优化以及可访问性等方面。合理使用图片不仅能提升页面加载速度,还能增强用户体验和SEO效果。
前端
图片优化
用户体验
开发规范
技术文档
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
编程
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
2026-04-12 21:54:21 +0800 CST
view 560
深入解读 ICLR 2026 论文 LRT,揭示如何用轻量级推理网络将冗长的思维链压缩为隐式向量,实现推理效率数十倍提升
AI
LLM
推理优化
思维链
ICLR2026
Headroom 深度实战:当 AI Agent 学会「精准瘦身」——从上下文压缩到生产级 Token 优化完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 学会「精准瘦身」——从上下文压缩到生产级 Token 优化完全指南(2026)
2026-06-13 02:46:52 +0800 CST
view 40
Headroom 是一个专为 AI Agent 设计的上下文压缩层,可以在发送给 LLM 之前压缩 60-95% 的 Token,同时保持答案质量不变。本文从原理到实践深度拆解 Headroom,包括核心架构、六大压缩算法、Python/TypeScript 集成示例、Proxy 模式、MCP 服务器、Cross-Agent Memory、性能基准测试和生产环境最佳实践。
AI Agent
上下文压缩
Token优化
LLM
Python
JavaScript
开源项目
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
编程
vLLM 2026 深度解析:从 PagedAttention 到多节点分布式推理的全链路技术实战
2026-05-03 15:13:07 +0800 CST
view 365
2026年深度解析vLLM核心架构,从PagedAttention进化到多节点分布式推理,涵盖SIG社区组织、v1架构重写、生产部署实战与性能优化全链路指南。
vLLM
PagedAttention
LLM
推理优化
分布式
Kubernetes
Python
SkyPilot 深度解析:打破云厂商锁定的AI工作负载统一调度平台——从多云GPU管理到成本优化的完整技术指南
编程
SkyPilot 深度解析:打破云厂商锁定的AI工作负载统一调度平台——从多云GPU管理到成本优化的完整技术指南
2026-05-17 21:16:36 +0800 CST
view 237
深度解析SkyPilot如何打破云厂商锁定,实现AI工作负载的统一调度与成本优化。从架构设计到代码实战,全面掌握多云GPU管理技术。
SkyPilot
AI基础设施
多云管理
GPU调度
成本优化
Cloudflare Workers 深度解析:V8 Isolates 如何让边缘计算快 100 倍
编程
Cloudflare Workers 深度解析:V8 Isolates 如何让边缘计算快 100 倍
2026-05-12 02:39:54 +0800 CST
view 249
深度解析Cloudflare Workers核心架构:V8 Isolates冷启动<1ms比容器快100-500倍、Dynamic Workers按需沙箱执行AI代码、边缘计算200+节点延迟低至4ms、Go WASM体积压缩至187KB、M3U预检200微秒解析
CloudflareWorkers,边缘计算,V8Isolates,无服务器,DynamicWorkers,冷启动优化,WASM,Go语言,TinyGo
Headroom 深度实战:AI 上下文压缩的工程革命——从原理到生产级部署完全指南(2026)
编程
Headroom 深度实战:AI 上下文压缩的工程革命——从原理到生产级部署完全指南(2026)
2026-06-04 11:44:46 +0800 CST
view 134
深入解析 Headroom 上下文压缩框架:60-95% Token 节省率如何实现?从 CacheAligner、SmartCrusher、CodeCompressor、Kompress-base 算法原理到生产级 Docker/Kubernetes 部署完整指南
AI,Agent,上下文压缩,Token优化,Headroom,Claude Code,工程实践
Matt Pocock Skills 深度实战:AI Agent 工程化技能集——从需求对齐到架构审查的完整指南(2026)
编程
Matt Pocock Skills 深度实战:AI Agent 工程化技能集——从需求对齐到架构审查的完整指南(2026)
2026-06-04 12:45:43 +0800 CST
view 161
2026年5月GitHub月榜第2名,月增星71266,总星112644。深入解析Matt Pocock Skills如何将TDD、需求对齐、架构审查等工程纪律固化为可执行的AI技能,让AI编程真正做到有纪律、有深度、有反馈。
AI编程
工程实践
TypeScript
Claude Code
自动化测试
架构优化
开源项目
DuckDB 1.5.0 "Variegata" 深度解析:嵌入式分析数据库的性能巅峰
编程
DuckDB 1.5.0 "Variegata" 深度解析:嵌入式分析数据库的性能巅峰
2026-05-12 08:14:38 +0800 CST
view 320
深度解析DuckDB 1.5.0核心新特性:VARIANT数据类型支持半结构化数据、GEOMETRY空间数据类型成为内置类型、SIMD指令集深度优化使聚合查询性能提升3-5倍、全新CLI客户端提升开发体验、DuckLake v1.0湖仓一体格式支持,附物联网与电商实战案例与性能Benchmark
DuckDB 1.5
嵌入式分析
OLAP
VARIANT类型
GEOMETRY空间数据
SIMD优化
向量化执行
DuckLake
我和 Claude Code 聊了 605 句,直到运行 /insights 才发现一直在做无用功
案例
我和 Claude Code 聊了 605 句,直到运行 /insights 才发现一直在做无用功
2026-05-04 23:01:37 +0800 CST
view 294
通过Claude Code的/insights命令复盘一个月的AI编程会话,发现错误模式,优化CLAUDE.md和自定义Skills,显著提升开发效率
Claude Code
insights
CLAUDE.md
效率优化
自定义Skills
AI编程
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
35
36
37
38
39
下一页