程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Wasmtime v46 深度解析:WebAssembly 生产级运行时的 2026 架构革命——Cranelift、WASI 0.2 与 Component Model 全栈指南
编程
Wasmtime v46 深度解析:WebAssembly 生产级运行时的 2026 架构革命——Cranelift、WASI 0.2 与 Component Model 全栈指南
2026-06-30 11:48:41 +0800 CST
view 98
深度解析 Wasmtime v46:Cranelift JIT 编译器、WASI 0.2 系统接口、Component Model 组件化架构,以及 AI 推理边缘部署实战
WebAssembly
Wasmtime
WASI
Bytecode Alliance
Cranelift
Component Model
Rust
边缘计算
Serverless
AI推理
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
编程
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
2026-06-02 21:19:20 +0800 CST
view 1278
Headroom 是专为 LLM 设计的通用压缩层,以 Library、Proxy、MCP Server 三种形态存在,在信息不丢失的前提下把 Token 消耗砍掉 60-95%。本文从信息论底层原理讲起,完整拆解四层压缩管线,结合真实代码实战演示接入方式。
LLM
Token优化
GitHub Trending
Python
RAG
当编译器成为自动驾驶的最后一块拼图:MLIR 如何让特斯拉 FSD 反应快 20%
编程
当编译器成为自动驾驶的最后一块拼图:MLIR 如何让特斯拉 FSD 反应快 20%
2026-04-11 12:56:32 +0800 CST
view 528
从特斯拉 FSD V14.3 的 MLIR 重写出发,系统讲解多级中间表示(MLIR)编译器框架的核心原理、方言系统、以及在自动驾驶 AI 推理中的应用。
MLIR
编译器
特斯拉
FSD
自动驾驶
LLVM
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
编程
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
2026-06-02 21:45:53 +0800 CST
view 449
Hermes WebUI 今日飙升 1725 星。本文深度拆解其架构设计、SSE流式传输机制、多模型路由策略、工具调用可视化实现,以及从本地部署到生产级优化的完整指南。
Hermes
WebUI
SSE
LLM
Agent
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
编程
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
2026-06-02 22:14:57 +0800 CST
view 327
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表宝塔日志
代码
如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表宝塔日志
2024-11-19 09:55:50 +0800 CST
view 1782
本文介绍了如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表。脚本使用`DELETEFROMlogs;`SQL语句删除所有记录,并提供了执行脚本的步骤和注意事项。强调了操作的不可逆性,并建议在执行前备份数据库文件。还提到可以使用`VACUUM;`来整理数据库空间。
数据库管理
Shell脚本
SQL操作
宝塔日志
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 372
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 416
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
编程
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
2026-06-02 22:15:17 +0800 CST
view 458
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
最全面的 `history` 命令指南
代码
最全面的 `history` 命令指南
2024-11-18 21:32:45 +0800 CST
view 1786
本文全面介绍了Linux和Unix系统中的`history`命令,包括其基本用法和高级选项。用户可以通过该命令查看、清空和管理命令历史记录,使用不同选项如`-c`、`-d`、`-w`等来操作历史记录。此外,文中还讨论了如何通过环境变量设置来优化历史记录的管理和使用。
Linux
Unix
命令行
Shell
技术
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 355
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
编程
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
2026-06-02 23:44:03 +0800 CST
view 409
Microsoft 开源的 MarkItDown 在 2026 年引爆 AI 工程圈。本文从源码级架构解析、多格式解析引擎、与 LLM 工具链的集成实战、性能优化到生产级 RAG 管道,全面拆解这款改变 AI 工程范式的工具。
Microsoft
MarkItDown
Markdown
LLM
RAG
Python
文档解析
AI工程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
编程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
2026-06-11 15:20:19 +0800 CST
view 370
Netflix工程师开源的AI上下文压缩工具Headroom,能在保持答案质量的前提下将Token消耗压缩60-95%,累计节省70万美元成本。本文深度剖析其架构设计、CCR可逆机制、跨Agent记忆共享与生产级集成实践。
AI编程
Token压缩
上下文管理
LLM优化
OpenSource
Python 工具链的 Rust 化革命:从 uv、Ruff 到 LiteLLM——当 Rust 吃掉 Python 的工具生态
编程
Python 工具链的 Rust 化革命:从 uv、Ruff 到 LiteLLM——当 Rust 吃掉 Python 的工具生态
2026-06-30 14:43:40 +0800 CST
view 61
深度解析Python工具链的Rust化革命:从uv的包管理、Ruff的静态分析到LiteLLM的AI网关迁移,万字长文剖析Rust如何以10-100倍的性能优势重塑Python开发生态
Rust
Python
uv
Ruff
LiteLLM
Polars
性能优化
包管理
Pydantic
OpenClaw 深度实战:37万星背后的AI Agent工程化完全指南——从Pi Agent内核到生产级多信道部署(2026)
编程
OpenClaw 深度实战:37万星背后的AI Agent工程化完全指南——从Pi Agent内核到生产级多信道部署(2026)
2026-06-03 00:16:22 +0800 CST
view 428
OpenClaw在60天内星标突破37万,超越React十年积累。本文从Pi Agent极简内核、Skill热插拔机制、LCM无损上下文、多Agent协作四个维度,完整拆解OpenClaw的设计哲学与工程实践。
OpenClaw
AI Agent
Pi Agent
开源
Skill机制
LCM
教程
Python 工具链 Rust 化深度解析:从 uv、Ruff 到 LiteLLM——当系统级语言重塑 Python 开发体验
编程
Python 工具链 Rust 化深度解析:从 uv、Ruff 到 LiteLLM——当系统级语言重塑 Python 开发体验
2026-06-30 14:44:22 +0800 CST
view 69
深度解析Python工具链的Rust化革命:从uv的包管理、Ruff的静态分析到LiteLLM的AI网关迁移,万字长文剖析Rust如何以10-100倍的性能优势重塑Python开发生态
Rust
Python
uv
Ruff
LiteLLM
Polars
性能优化
包管理
Pydantic
Rust 正在吃掉前端:Rolldown、Oxc 与 Vite 8 统一工具链的技术真相与行业启示
编程
Rust 正在吃掉前端:Rolldown、Oxc 与 Vite 8 统一工具链的技术真相与行业启示
2026-04-20 18:19:12 +0800 CST
view 553
深度解析 Rust 如何通过 Rolldown、Oxc 与 Vite 8 重塑 JavaScript 工具链格局,探讨 Rust 在前端领域渗透的深层逻辑与开发者行动建议。
Rust
Vite
Rolldown
Oxc
前端工具链
Rust 正在重塑 Python 的工具链:深入解析 uv、Ruff 与 LiteLLM 的架构革命与 100 倍性能提升
编程
Rust 正在重塑 Python 的工具链:深入解析 uv、Ruff 与 LiteLLM 的架构革命与 100 倍性能提升
2026-06-30 14:45:17 +0800 CST
view 71
深度解析Python工具链的Rust化革命:从uv的包管理、Ruff的静态分析到LiteLLM的AI网关迁移,万字长文剖析Rust如何以10-100倍的性能优势重塑Python开发生态
Rust
Python
uv
Ruff
LiteLLM
Polars
性能优化
包管理
Pydantic
免费 + 100万上下文 + 内置搜索:Gemini CLI 凭什么挑战 Claude Code?
编程
免费 + 100万上下文 + 内置搜索:Gemini CLI 凭什么挑战 Claude Code?
2026-05-11 12:52:32 +0800 CST
view 430
Google 开源 Gemini CLI,Apache 2.0 许可,完全免费,100万 token 上下文全部可用,内置 Google 搜索增强,支持 Skills/MCP/Hooks 系统,CI/CD 集成完整。本文深度对比与 Claude Code 的差异、实战场景和最佳实践。
Gemini CLI,Claude Code,AI编程工具,Google,100万token上下文,MCP协议,Skills系统,免费AI助手,终端编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 1224
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
OpenClaw 深度解析:30万星开源 AI Agent 框架的技术内核——从 Gateway 到 Memory 的完整架构革命
编程
OpenClaw 深度解析:30万星开源 AI Agent 框架的技术内核——从 Gateway 到 Memory 的完整架构革命
2026-06-30 16:44:48 +0800 CST
view 78
2026年最火爆的开源项目,30万Star背后的技术密码。万字长文拆解Gateway、Agent、Skills、Memory四大核心模块,从架构原理到代码实战全覆盖。
OpenClaw
AI Agent
Gateway
Skills
Memory
开源框架
人工智能
本地优先
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 389
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
编程
MarkItDown 深度实战:当微软用Python重写文档预处理——从转换器链到LLM集成的生产级完全指南(2026)
2026-06-12 13:48:19 +0800 CST
view 274
深度剖析微软开源的MarkItDown工具,详解其转换器链架构、插件系统、LLM集成和大规模文档处理性能优化,提供15个完整代码示例和生产级部署方案。
MarkItDown
文档预处理
LLM
RAG
Python
微软
Agent Skills 深度实战:当 Google 工程总监把 20 年软件工程实践蒸馏成 AI 可执行的 Skill——从 6 阶段生命周期到 Anti-Rationalization 生产级完全指南(2026)
编程
Agent Skills 深度实战:当 Google 工程总监把 20 年软件工程实践蒸馏成 AI 可执行的 Skill——从 6 阶段生命周期到 Anti-Rationalization 生产级完全指南(2026)
2026-06-23 02:54:18 +0800 CST
view 125
Addy Osmani 开源的 Agent Skills 把 Google 20 年软件工程实践蒸馏成 AI 可执行的 Skill,深度解析 6 阶段生命周期、21 个技能、Anti-Rationalization 设计哲学及完整生产部署实战。
Agent Skills
AI编程
软件工程
Addy Osmani
AI Agent
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
21
22
23
24
25
...
33
下一页