程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Hermes彻底碾压OpenClaw?10周登顶全球Token消耗榜的AI Agent架构解析
编程
Hermes彻底碾压OpenClaw?10周登顶全球Token消耗榜的AI Agent架构解析
2026-05-21 16:25:24 +0800 CST
view 197
Hermes登顶OpenRouter全球应用Token消耗榜榜首,10周内从零到全球调用量第一,自我进化技能机制、有限记忆、模型解耦、本地优先,针对性解决OpenClaw安全漏洞和效率问题。
AI Agent
OpenClaw
Hermes
架构对比
安全审计
X-CMD:给 AI Agent 装上 Shell 超能力,一句话控制你电脑上的软件
编程
X-CMD:给 AI Agent 装上 Shell 超能力,一句话控制你电脑上的软件
2026-04-17 12:55:21 +0800 CST
view 324
介绍 GitHub 开源项目 X-CMD,为 AI Agent 提供 1000+ 轻量命令行工具,一句话控制电脑软件,支持 OpenClaw/Claude Code/Gemini CLI 等。
开源
X-CMD
AI Agent
Shell
命令行工具
GitHub
自动化
Headroom 深度实战:当 AI Agent 学会「省着吃」——从 Token 暴降 60-95% 到可逆上下文压缩的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 学会「省着吃」——从 Token 暴降 60-95% 到可逆上下文压缩的生产级完全指南(2026)
2026-06-09 14:16:12 +0800 CST
view 101
Headroom 是一个开源的 AI Agent 上下文压缩中间层,通过六大专用算法实现 60-95% 的 Token 节省,CCR 可逆存储确保信息零丢失,跨 Agent 记忆打破协作孤岛。
AI Agent
Headroom
上下文压缩
Token优化
LLM
开源项目
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
编程
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
2026-06-15 11:18:23 +0800 CST
view 60
深度解析大模型推理中 KV Cache 管理的五世代演进:从连续分配到 PagedAttention,再到异构缓存、分布式 KV 和统一混合内存架构。结合 vLLM、SGLang、TensorRT-LLM 给出生产环境选型指南。
LLM
大模型
KVCache
PagedAttention
vLLM
SGLang
TensorRT
推理优化
显存管理
分布式
Helidon 4.4:当 Java 微服务框架开始"长脑子",AI 编排不再是 Python 专利
编程
Helidon 4.4:当 Java 微服务框架开始"长脑子",AI 编排不再是 Python 专利
2026-04-08 15:04:17 +0800 CST
view 471
Oracle Helidon 4.4.0 引入 AI Agent 编排能力,Java 微服务框架进入 AI 原生时代。深度解析 Workflows、Dynamic Agents 两种执行模式,完整代码实战。
Helidon
Java
AI Agent
LangChain4j
微服务
Headroom 深度实战:当上下文窗口成为AI Agent的成本黑洞——从Token爆炸到60-95%压缩率的生产级完全指南(2026)
编程
Headroom 深度实战:当上下文窗口成为AI Agent的成本黑洞——从Token爆炸到60-95%压缩率的生产级完全指南(2026)
2026-06-15 13:19:56 +0800 CST
view 61
深度解析开源项目Headroom:AI Agent的上下文压缩中间层,60-95% Token节省,CCR可逆压缩机制,六大压缩引擎架构分析,生产级部署指南。
AI Agent
Token压缩
上下文管理
LLM
Claude Code
Cursor
Headroom
Python
开源工具
工程实践
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
编程
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
2026-04-09 04:54:56 +0800 CST
view 639
Google于2026年4月发布Gemma 4开源模型系列,首次全面切换Apache 2.0许可证,搭载Per-Layer Embedding架构创新,26B MoE以3.8B激活参数击败Qwen3-235B。本文深度解析PLE架构、稀疏激活机制与全规格产品矩阵。
Gemma 4
Google
开源模型
Apache 2.0
MoE
Per-Layer Embedding
45+在线图片工具+REST API+AI修图:SnapOtter让NAS秒变个人图片处理中心
编程
45+在线图片工具+REST API+AI修图:SnapOtter让NAS秒变个人图片处理中心
2026-04-28 18:27:20 +0800 CST
view 523
基于Docker的自托管图片编辑器SnapOtter:45+工具、REST API接入AI Agent、本地AI修图(OCR/背景移除/高清化)、数据永久存NAS。海康智存部署教程。
Docker
NAS
图片处理
AI修图
本地部署
REST API
OpenClaw
Hermes
DuckLake v1.0 深度解析:DuckDB 团队如何用关系型数据库颠覆数据湖架构——926 倍性能背后的湖仓一体新范式
编程
DuckLake v1.0 深度解析:DuckDB 团队如何用关系型数据库颠覆数据湖架构——926 倍性能背后的湖仓一体新范式
2026-05-09 13:14:28 +0800 CST
view 637
DuckDB 团队于 2026 年 4 月 13 日发布 DuckLake v1.0——一种用关系型数据库存储元数据的湖仓一体新范式。官方基准显示查询速度比 Iceberg 快 926 倍,数据摄取快 105 倍。本文深入解析其架构原理、数据内联机制、性能差异根因及实战代码。
DuckDB,DuckLake,数据湖,湖仓一体,Apache Iceberg,Delta Lake,Parquet,OLAP
编程
apache自带的ab(http)与abs(https)压测工具用法详解
2024-11-19 01:53:49 +0800 CST
view 8362
本文详细介绍了Apache自带的ab(http)和abs(https)压测工具的使用方法,包括吞吐率、并发连接数、用户请求等待时间等基本概念。通过示例代码展示如何使用ab工具进行压力测试,并提供了测试结果的分析,包括请求数、响应时间等关键指标。最后,比较了Windows和Linux环境下的测试结果,指出了服务器性能的优化方向。
性能测试
网络工具
Apache
Polars 深度实战:碾压 Pandas 的 Rust 极速 DataFrame 引擎——从 Apache Arrow 内存模型到 Lazy Execution 的完全指南(2026)
编程
Polars 深度实战:碾压 Pandas 的 Rust 极速 DataFrame 引擎——从 Apache Arrow 内存模型到 Lazy Execution 的完全指南(2026)
2026-06-02 16:24:32 +0800 CST
view 191
深度解析 Polars 如何基于 Rust 和 Apache Arrow 实现比 Pandas 快 94 倍的性能,涵盖 Lazy Execution、查询优化、生产实践
Polars
Rust
DataFrame
Python数据分析
高性能计算
Apache Arrow
Lazy Execution
Kubernetes v1.36 "Haru" 深度实战:当安全默认配置遇见动态资源分配——从 Pod User Namespaces GA 到生产级集群迁移的完全指南(2026)
编程
Kubernetes v1.36 "Haru" 深度实战:当安全默认配置遇见动态资源分配——从 Pod User Namespaces GA 到生产级集群迁移的完全指南(2026)
2026-06-16 20:23:25 +0800 CST
view 20
Kubernetes v1.36 Haru 深度实战指南,涵盖 71 项增强中 Pod User Namespaces GA、Mutating Admission Policies GA、DRA 动态资源分配重大增强、Gang Scheduling Alpha、Ingress NGINX 退役与 Gateway API 迁移等核心主题,附带完整代码示例和生产级升级清单。
Kubernetes
v1.36
Haru
DRA
User Namespaces
Gateway API
Gang Scheduling
云原生
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
编程
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
2026-04-19 22:17:39 +0800 CST
view 627
深入解析Google LiteRT-LM端侧LLM推理引擎的核心架构:分层内存池、KV Cache量化、算子融合、WebGPU运行时。与TensorFlow Lite、llama.cpp、MLX横向对比,提供生产级部署实战指南。
Google
端侧AI
LiteRT-LM
WebGPU
量化
KV Cache
TensorFlow Lite
LLM推理
Scrapling 深度实战:当爬虫学会「自适应进化」——从 StealthyFetcher 隐身引擎到自适应解析的生产级完全指南(2026)
编程
Scrapling 深度实战:当爬虫学会「自适应进化」——从 StealthyFetcher 隐身引擎到自适应解析的生产级完全指南(2026)
2026-06-11 09:21:13 +0800 CST
view 120
Scrapling 是2026年GitHub最火的下一代Python爬虫框架,通过StealthyFetcher隐身引擎(JA3/JA4指纹伪装)和AdaptiveParser自适应解析,让Cloudflare通过率从5%提升到92%,网站改版不再导致爬虫报废。本文深度拆解架构设计、生产级实战代码、性能对比及分布式调度方案。
Scrapling
Python
爬虫
反爬虫
Cloudflare
StealthyFetcher
自适应解析
网页抓取
数据采集
Shell 里给变量赋值为多行文本
编程
Shell 里给变量赋值为多行文本
2024-11-18 20:25:45 +0800 CST
view 1729
在Shell中,通常只能给变量赋值单行文本。为了实现多行文本赋值,可以使用`read`命令结合`EOF`标记符。通过`read-r-d''var<<EOF`的方式,可以读取多行文本并赋值给变量。此外,还可以从外部文件读取内容并赋值。此方法简单方便,适用于多种场景。
Shell编程
脚本
命令行
如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表宝塔日志
代码
如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表宝塔日志
2024-11-19 09:55:50 +0800 CST
view 1711
本文介绍了如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表。脚本使用`DELETEFROMlogs;`SQL语句删除所有记录,并提供了执行脚本的步骤和注意事项。强调了操作的不可逆性,并建议在执行前备份数据库文件。还提到可以使用`VACUUM;`来整理数据库空间。
数据库管理
Shell脚本
SQL操作
宝塔日志
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 263
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
最全面的 `history` 命令指南
代码
最全面的 `history` 命令指南
2024-11-18 21:32:45 +0800 CST
view 1705
本文全面介绍了Linux和Unix系统中的`history`命令,包括其基本用法和高级选项。用户可以通过该命令查看、清空和管理命令历史记录,使用不同选项如`-c`、`-d`、`-w`等来操作历史记录。此外,文中还讨论了如何通过环境变量设置来优化历史记录的管理和使用。
Linux
Unix
命令行
Shell
技术
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 242
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 333
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
编程
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
2026-05-02 10:33:28 +0800 CST
view 362
深入拆解Apache Doris 4.1的技术内核:从FE/BE架构到存算分离、从原生向量检索到混合搜索、从RAG实战到生产部署,全方位解析实时数仓如何演化为AI时代统一数据底座
Apache Doris
向量检索
实时数仓
RAG
存算分离
OLAP
AI数据库
比Chrome快9倍!这个Zig写的头浏览器正在悄悄火
编程
比Chrome快9倍!这个Zig写的头浏览器正在悄悄火
2026-04-21 13:39:10 +0800 CST
view 370
用Zig语言从零写的AI浏览器,比Chrome快9倍内存省16倍。兼容CDP协议,AI Agent和爬虫的性价比神器。
Lightpanda
Zig
浏览器
AI
headless
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 619
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
Feynman 科研代理:让 AI 自动完成文献综述与论文审计
案例
Feynman 科研代理:让 AI 自动完成文献综述与论文审计
2026-05-04 22:56:35 +0800 CST
view 396
Feynman是Hermes生态中的科研代理框架,由研究员、评审员、撰写员、核实员四个智能体组成,能自动完成文献综述、论文审计、实验复现等复杂科研任务
AI科研
多智能体
自动化
文献综述
论文审计
Hermes
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
...
29
下一页