程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表宝塔日志
代码
如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表宝塔日志
2024-11-19 09:55:50 +0800 CST
view 1764
本文介绍了如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表。脚本使用`DELETEFROMlogs;`SQL语句删除所有记录,并提供了执行脚本的步骤和注意事项。强调了操作的不可逆性,并建议在执行前备份数据库文件。还提到可以使用`VACUUM;`来整理数据库空间。
数据库管理
Shell脚本
SQL操作
宝塔日志
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 345
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 385
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
编程
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
2026-06-02 22:15:17 +0800 CST
view 393
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
最全面的 `history` 命令指南
代码
最全面的 `history` 命令指南
2024-11-18 21:32:45 +0800 CST
view 1763
本文全面介绍了Linux和Unix系统中的`history`命令,包括其基本用法和高级选项。用户可以通过该命令查看、清空和管理命令历史记录,使用不同选项如`-c`、`-d`、`-w`等来操作历史记录。此外,文中还讨论了如何通过环境变量设置来优化历史记录的管理和使用。
Linux
Unix
命令行
Shell
技术
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 310
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
编程
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
2026-05-23 20:00:37 +0800 CST
view 272
深度剖析 Unsloth 如何通过手写 Triton 内核、智能显存管理和 LoRA/QLoRA 优化,实现训练速度 2-5 倍提升、显存占用降低 70% 的技术奇迹。
LLM
微调
Unsloth
LoRA
深度学习
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
编程
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
2026-06-02 23:44:03 +0800 CST
view 363
Microsoft 开源的 MarkItDown 在 2026 年引爆 AI 工程圈。本文从源码级架构解析、多格式解析引擎、与 LLM 工具链的集成实战、性能优化到生产级 RAG 管道,全面拆解这款改变 AI 工程范式的工具。
Microsoft
MarkItDown
Markdown
LLM
RAG
Python
文档解析
AI工程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
编程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
2026-06-11 15:20:19 +0800 CST
view 332
Netflix工程师开源的AI上下文压缩工具Headroom,能在保持答案质量的前提下将Token消耗压缩60-95%,累计节省70万美元成本。本文深度剖析其架构设计、CCR可逆机制、跨Agent记忆共享与生产级集成实践。
AI编程
Token压缩
上下文管理
LLM优化
OpenSource
OctaFuse Gateway:统一管理Coding Plan/Token Plan的开源AI网关,个人SaaS都能用
编程
OctaFuse Gateway:统一管理Coding Plan/Token Plan的开源AI网关,个人SaaS都能用
2026-06-22 21:00:01 +0800 CST
view 123
OctaFuse Gateway开源AI网关,把Provider、模型路由、API Key、用户、预算、用量审计、财务记账和管理后台放在一起。个人用可统一Coding Plan/Token Plan入口;做SaaS可变成LLM服务底座。支持OpenAI/Anthropic/Gemini多协议,Provider Key池统一调度多套额度,三层成本口径(metered/standard/charged),自带Admin后台+Playground+Simulator。
OctaFuse
AI网关
开源
LLM管理
多模型路由
SaaS
计费审计
Provider Key池
Python 工具链的 Rust 化革命:从 uv、Ruff 到 LiteLLM——当 Rust 吃掉 Python 的工具生态
编程
Python 工具链的 Rust 化革命:从 uv、Ruff 到 LiteLLM——当 Rust 吃掉 Python 的工具生态
2026-06-30 14:43:40 +0800 CST
view 11
深度解析Python工具链的Rust化革命:从uv的包管理、Ruff的静态分析到LiteLLM的AI网关迁移,万字长文剖析Rust如何以10-100倍的性能优势重塑Python开发生态
Rust
Python
uv
Ruff
LiteLLM
Polars
性能优化
包管理
Pydantic
OpenClaw 深度实战:37万星背后的AI Agent工程化完全指南——从Pi Agent内核到生产级多信道部署(2026)
编程
OpenClaw 深度实战:37万星背后的AI Agent工程化完全指南——从Pi Agent内核到生产级多信道部署(2026)
2026-06-03 00:16:22 +0800 CST
view 383
OpenClaw在60天内星标突破37万,超越React十年积累。本文从Pi Agent极简内核、Skill热插拔机制、LCM无损上下文、多Agent协作四个维度,完整拆解OpenClaw的设计哲学与工程实践。
OpenClaw
AI Agent
Pi Agent
开源
Skill机制
LCM
教程
Python 工具链 Rust 化深度解析:从 uv、Ruff 到 LiteLLM——当系统级语言重塑 Python 开发体验
编程
Python 工具链 Rust 化深度解析:从 uv、Ruff 到 LiteLLM——当系统级语言重塑 Python 开发体验
2026-06-30 14:44:22 +0800 CST
view 13
深度解析Python工具链的Rust化革命:从uv的包管理、Ruff的静态分析到LiteLLM的AI网关迁移,万字长文剖析Rust如何以10-100倍的性能优势重塑Python开发生态
Rust
Python
uv
Ruff
LiteLLM
Polars
性能优化
包管理
Pydantic
Rust 正在吃掉前端:Rolldown、Oxc 与 Vite 8 统一工具链的技术真相与行业启示
编程
Rust 正在吃掉前端:Rolldown、Oxc 与 Vite 8 统一工具链的技术真相与行业启示
2026-04-20 18:19:12 +0800 CST
view 516
深度解析 Rust 如何通过 Rolldown、Oxc 与 Vite 8 重塑 JavaScript 工具链格局,探讨 Rust 在前端领域渗透的深层逻辑与开发者行动建议。
Rust
Vite
Rolldown
Oxc
前端工具链
Rust 正在重塑 Python 的工具链:深入解析 uv、Ruff 与 LiteLLM 的架构革命与 100 倍性能提升
编程
Rust 正在重塑 Python 的工具链:深入解析 uv、Ruff 与 LiteLLM 的架构革命与 100 倍性能提升
2026-06-30 14:45:17 +0800 CST
view 12
深度解析Python工具链的Rust化革命:从uv的包管理、Ruff的静态分析到LiteLLM的AI网关迁移,万字长文剖析Rust如何以10-100倍的性能优势重塑Python开发生态
Rust
Python
uv
Ruff
LiteLLM
Polars
性能优化
包管理
Pydantic
免费 + 100万上下文 + 内置搜索:Gemini CLI 凭什么挑战 Claude Code?
编程
免费 + 100万上下文 + 内置搜索:Gemini CLI 凭什么挑战 Claude Code?
2026-05-11 12:52:32 +0800 CST
view 396
Google 开源 Gemini CLI,Apache 2.0 许可,完全免费,100万 token 上下文全部可用,内置 Google 搜索增强,支持 Skills/MCP/Hooks 系统,CI/CD 集成完整。本文深度对比与 Claude Code 的差异、实战场景和最佳实践。
Gemini CLI,Claude Code,AI编程工具,Google,100万token上下文,MCP协议,Skills系统,免费AI助手,终端编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 1165
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
OpenClaw 深度解析:30万星开源 AI Agent 框架的技术内核——从 Gateway 到 Memory 的完整架构革命
编程
OpenClaw 深度解析:30万星开源 AI Agent 框架的技术内核——从 Gateway 到 Memory 的完整架构革命
2026-06-30 16:44:48 +0800 CST
view 11
2026年最火爆的开源项目,30万Star背后的技术密码。万字长文拆解Gateway、Agent、Skills、Memory四大核心模块,从架构原理到代码实战全覆盖。
OpenClaw
AI Agent
Gateway
Skills
Memory
开源框架
人工智能
本地优先
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 366
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
编程
MarkItDown 深度实战:当微软用Python重写文档预处理——从转换器链到LLM集成的生产级完全指南(2026)
2026-06-12 13:48:19 +0800 CST
view 229
深度剖析微软开源的MarkItDown工具,详解其转换器链架构、插件系统、LLM集成和大规模文档处理性能优化,提供15个完整代码示例和生产级部署方案。
MarkItDown
文档预处理
LLM
RAG
Python
微软
Agent Skills 深度实战:当 Google 工程总监把 20 年软件工程实践蒸馏成 AI 可执行的 Skill——从 6 阶段生命周期到 Anti-Rationalization 生产级完全指南(2026)
编程
Agent Skills 深度实战:当 Google 工程总监把 20 年软件工程实践蒸馏成 AI 可执行的 Skill——从 6 阶段生命周期到 Anti-Rationalization 生产级完全指南(2026)
2026-06-23 02:54:18 +0800 CST
view 81
Addy Osmani 开源的 Agent Skills 把 Google 20 年软件工程实践蒸馏成 AI 可执行的 Skill,深度解析 6 阶段生命周期、21 个技能、Anti-Rationalization 设计哲学及完整生产部署实战。
Agent Skills
AI编程
软件工程
Addy Osmani
AI Agent
Superpowers 深度拆解:123K Star 的 AI 编程工作流框架,如何让 Claude Code 秒变资深工程师
编程
Superpowers 深度拆解:123K Star 的 AI 编程工作流框架,如何让 Claude Code 秒变资深工程师
2026-05-02 07:33:08 +0800 CST
view 425
Superpowers 是 123K Star 的 AI 编程工作流框架,核心理念是 Process over Prompt。本文深度拆解其 Skills 系统设计、TDD 工作流、子代理驱动开发等核心技术,并提供完整实战案例。
Superpowers
Claude Code
AI编程
TDD
开源项目
Skills Framework
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
编程
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
2026-06-12 14:20:52 +0800 CST
view 191
深度解析 ICML 2026 接收的 CLEAR 推理优化方法。浙江大学、腾讯、北京大学联合提出:对没有希望的问题理性放弃,把算力集中到能解决的问题上。包含完整 Python 实现、vLLM/SGLang 集成、生产级部署指南。
LLM
推理优化
ICML 2026
CLEAR
算力分配
Obsidian Agent Skills 深度解析:从知识库到自动化工作流的工程实践
编程
Obsidian Agent Skills 深度解析:从知识库到自动化工作流的工程实践
2026-04-12 08:54:32 +0800 CST
view 639
深度解析 Obsidian Agent Skills 的工程架构:四层架构设计、Skill Registry 路由机制、与 MCP 的关系,以及如何从零构建 AI 辅助的论文写作工作流。
Obsidian
Agent Skills
知识管理
AI
自动化工作流
OpenClaw
MCP
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
5
6
7
8
9
...
17
下一页