程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
编程
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
2026-05-19 12:42:27 +0800 CST
view 337
2026年,边缘AI不再只是云端模型的精简版。本文深入剖析DeepSeek-R1 CPU版的技术原理,从模型蒸馏、量化技术的底层原理到生产环境的完整部署方案,提供可直接落地的代码和可量化的性能数据。
DeepSeek
R1
边缘计算
AI推理
模型蒸馏
量化
llama.cpp
Ollama
端侧AI
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
编程
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
2026-06-08 22:52:24 +0800 CST
view 274
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
编程
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
2026-06-08 22:53:03 +0800 CST
view 180
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
Agent Skills 深度实战:当 AI 学会「工程师纪律」——从 Addy Osmani 的 7 个斜杠命令到生产级 AI 编程工作流的完全指南(2026)
编程
Agent Skills 深度实战:当 AI 学会「工程师纪律」——从 Addy Osmani 的 7 个斜杠命令到生产级 AI 编程工作流的完全指南(2026)
2026-06-15 00:50:09 +0800 CST
view 308
Agent Skills 是 Google 工程总监 Addy Osmani 开源的 AI 编程工程技能库,通过 7 个斜杠命令(/spec、/plan、/build、/test、/review、/code-simplify、/ship)将软件开发六阶段生命周期固化到 AI 工作流中,让 AI 从「代码生成器」升级为「工程助手」。
AI编程
Agent Skills
Addy Osmani
Claude Code
工程化
软件开发
Skill
生产级
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
编程
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
2026-05-30 15:42:55 +0800 CST
view 294
深度解析 LLM 推理优化的核心技术:PagedAttention 内存管理革命、投机解码加速策略、INT4/FP8 量化技术、MoE 架构优化,从架构原理到代码实战,让大模型推理成本下降 70%。
LLM
推理优化
vLLM
PagedAttention
投机解码
量化
MoE
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
编程
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
2026-06-15 11:18:23 +0800 CST
view 205
深度解析大模型推理中 KV Cache 管理的五世代演进:从连续分配到 PagedAttention,再到异构缓存、分布式 KV 和统一混合内存架构。结合 vLLM、SGLang、TensorRT-LLM 给出生产环境选型指南。
LLM
大模型
KVCache
PagedAttention
vLLM
SGLang
TensorRT
推理优化
显存管理
分布式
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
编程
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
2026-04-08 15:51:53 +0800 CST
view 1581
深度对比SGLang与vLLM两大LLM推理框架,从架构设计、核心原理、性能实测、适用场景多维度解析,附2026年选型建议
LLM
SGLang
vLLM
推理优化
大模型
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
编程
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
2026-06-10 01:20:57 +0800 CST
view 289
2026年Ollama本地大模型部署完全指南:从架构原理、GGUF量化、ModelFile自定义、多语言集成(Python/JS/Go)、RAG实战到Docker/K8s生产部署,8500字深度长文。
Ollama
本地部署
大模型
LLM
生产级
GGUF
量化
从零构建企业级本地化RAG系统:Ollama与RAGFlow深度实战
编程
从零构建企业级本地化RAG系统:Ollama与RAGFlow深度实战
2026-06-29 01:46:19 +0800 CST
view 87
深入探讨如何基于Ollama和RAGFlow构建完全本地化的RAG系统,涵盖架构设计、部署实战、代码实现和性能优化。
RAG
Ollama
RAGFlow
本地部署
LLM
分布式 LLM 推理架构深度实战:从 vLLM 单节点到 llm-d 多集群的生产级演进全链路解析
编程
分布式 LLM 推理架构深度实战:从 vLLM 单节点到 llm-d 多集群的生产级演进全链路解析
2026-05-09 03:39:58 +0800 CST
view 485
深度解析分布式 LLM 推理架构,从 vLLM 单节点到 llm-d 多集群的生产级演进。涵盖推理引擎层、编排调度层、Kubernetes 多机多卡部署实战、性能优化技巧及成本优化策略。
LLM
vLLM
分布式推理
Kubernetes
Ray
推理引擎
PydanticAI 深度实战:当 Python 类型系统遇见 AI Agent——从类型安全到生产级智能体工程完全指南(2026)
编程
PydanticAI 深度实战:当 Python 类型系统遇见 AI Agent——从类型安全到生产级智能体工程完全指南(2026)
2026-06-21 13:24:53 +0800 CST
view 138
PydanticAI深度实战:类型安全+依赖注入+评估驱动开发,从零构建生产级AI Agent,含完整代码示例和性能优化策略。
PydanticAI
Python
AI Agent
类型安全
生产级
LLM
Agent Lightning 深度解析:微软开源 AI Agent 训练框架——零代码改动,让任何 AI Agent 学会「自我进化」
编程
Agent Lightning 深度解析:微软开源 AI Agent 训练框架——零代码改动,让任何 AI Agent 学会「自我进化」
2026-05-16 03:14:41 +0800 CST
view 391
微软研究院开源 Agent Lightning:零代码改动训练任何 AI Agent,支持 RL/APO/SFT,已验证 128 GPU 大规模训练。
AgentLightning
强化学习
AI Agent
微软开源
LLM训练
从OpenClaw到Hermes Agent:两款爆火开源AI Agent的对决与深层技术哲学
编程
从OpenClaw到Hermes Agent:两款爆火开源AI Agent的对决与深层技术哲学
2026-04-18 16:15:01 +0800 CST
view 465
深度解析OpenClaw与Hermes Agent的功能差异与底层架构:Skill体系谁按下启动键、记忆系统谁在替谁记事、上下文管理的确定性优先哲学,以及两者背后的干预递减光谱与自动化控制权之争。
AI Agent
OpenClaw
Hermes
NousResearch
Skill系统
记忆系统
自进化
GitHub
开源
技术哲学
Pathway 深度解析:Python ETL 框架的流式处理革命 —— 用 Rust 引擎吊打 Flink/Spark,构建实时 LLM Pipeline
编程
Pathway 深度解析:Python ETL 框架的流式处理革命 —— 用 Rust 引擎吊打 Flink/Spark,构建实时 LLM Pipeline
2026-05-16 03:46:12 +0800 CST
view 360
55K+ Star,基于 Differential Dataflow 的 Rust 引擎,增量计算,内存计算,无缝集成 Python ML 生态——Pathway 正在重新定义实时流处理与 LLM Pipeline 的边界。
Python
流处理
实时分析
LLM
RAG
Pathway
ETL
开源项目
GitHub Trending
Andrej Karpathy Skills 深度实战:当 AI 学会了「编程自律」——从 CLAUDE.md 四大原则到 AI 编程行为矫正、从错误假设捕获到极简代码生成的完全指南(2026)
编程
Andrej Karpathy Skills 深度实战:当 AI 学会了「编程自律」——从 CLAUDE.md 四大原则到 AI 编程行为矫正、从错误假设捕获到极简代码生成的完全指南(2026)
2026-06-21 14:25:24 +0800 CST
view 116
深入剖析 GitHub 149K+ Stars 爆火项目 andrej-karpathy-skills,揭示 Andrej Karpathy 如何通过一份 65 行的 CLAUDE.md 文件,将 AI 编程助手的准确率从 65% 提升到 94%。
AI编程
Claude Code
LLM
行为准则
代码质量
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
编程
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
2026-06-16 04:47:57 +0800 CST
view 193
深度实战微软开源神器MarkItDown:从多格式文档解析到LLM友好Markdown转换,涵盖RAG系统构建、MCP集成、批量处理优化、生产级API服务部署,10000字完整指南。
MarkItDown
文档转换
Markdown
RAG
LLM
MCP
AI Agent
Python
OpenCode 深度解析:157K Star 的开源 AI 编程智能体——如何打造 Claude Code 的完美平替
编程
OpenCode 深度解析:157K Star 的开源 AI 编程智能体——如何打造 Claude Code 的完美平替
2026-05-16 05:45:45 +0800 CST
view 403
深度解析OpenCode——157K Star的开源AI编程智能体,支持75+ LLM提供商,如何成为Claude Code的完美平替
AI编程
开源
OpenCode
Claude Code平替
LLM
Headroom 深度实战:当 AI Agent 学会了「精打细算」——从 Token 成本黑洞到上下文压缩的底层原理、从 CCR 可逆存储到六大压缩算法的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 学会了「精打细算」——从 Token 成本黑洞到上下文压缩的底层原理、从 CCR 可逆存储到六大压缩算法的生产级完全指南(2026)
2026-06-21 15:57:54 +0800 CST
view 111
深度解析开源项目 Headroom:AI Agent 的上下文压缩中间层,60-95% Token 节省,CCR 可逆存储,六大压缩算法完全指南。
AI编程
Token压缩
Headroom
上下文管理
LLM推理优化
AI Agent
Obsidian Skills 深度解析:当 Agent Skills 规范让 AI Agent 真正"接管"本地知识库
编程
Obsidian Skills 深度解析:当 Agent Skills 规范让 AI Agent 真正"接管"本地知识库
2026-04-09 07:23:15 +0800 CST
view 828
深入解析 Obsidian CEO kepano 开源的 obsidian-skills 项目,探讨 Agent Skills 规范如何让 AI Agent 真正理解本地知识库的底层格式,实现从"工具集成"到"知识接管"的范式跃迁。
obsidian
agent-skills
claude-code
知识管理
ai-agent
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
编程
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
2026-04-09 07:55:23 +0800 CST
view 873
深度解析 METATRON:如何在本地零成本跑起一个完整的 AI 渗透测试助手,基于 Qwen 微调模型 + Ollama + MariaDB,无需 API Key,数据完全不出本地。
AI渗透测试
Ollama
Qwen
本地大模型
MariaDB
Pentest
安全工具
Agent
Andrej Karpathy Skills 深度实战:终结LLM编程的「四大天坑」——从 CLAUDE.md 规范到生产级 AI 辅助编程的完全指南(2026)
编程
Andrej Karpathy Skills 深度实战:终结LLM编程的「四大天坑」——从 CLAUDE.md 规范到生产级 AI 辅助编程的完全指南(2026)
2026-06-10 12:47:30 +0800 CST
view 344
前 Tesla AI 总监 Andrej Karpathy 开源的 CLAUDE.md 配置项目,系统性解决 LLM 编程四大天坑。本文深度解析四大核心原则、架构设计、代码实战,助你从「AI 代码生成器」进化到「AI 工程协作」。
AI编程
LLM
Claude Code
Python
测试驱动开发
Rolldown 与 VoidZero:当 Rust 重构整个 JavaScript 工具链,前端基建的终局之战
编程
Rolldown 与 VoidZero:当 Rust 重构整个 JavaScript 工具链,前端基建的终局之战
2026-06-29 11:43:40 +0800 CST
view 38
深度解析 Rolldown 与 VoidZero 的 Rust 全栈工具链蓝图,从源码架构到 Cloudflare 收购的战略意义,附完整实战迁移指南与性能基准测试。
Rolldown
VoidZero
Vite
Rust
前端工程化
构建工具
JavaScript工具链
Cloudflare
Oxc
尤雨溪
Wot UI:star,80+组件!官方Skill加持的uni-app多端组件库,轻量美观
案例
Wot UI:star,80+组件!官方Skill加持的uni-app多端组件库,轻量美观
2026-05-09 10:31:38 +0800 CST
view 485
Wot UI:star,80+组件的uni-app多端组件库。覆盖微信/支付宝/钉钉/H5/APP,使用TypeScript构建,支持CSS变量主题定制和暗黑模式,内置15种语言包。最亮眼的是官方Skill文件,可直接加载到Cursor/Claude Code等AI编码助手,让AI生成符合组件规范的代码。vs TDesign:uni-app版本bug多,Wot UI更稳定实用。
uni-app
组件库
多端开发
TypeScript
CSS变量
暗色模式
国际化
小程序
H5
APP
开源
AI Skill
UI框架
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
编程
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
2026-04-10 00:14:55 +0800 CST
view 1227
深度解析 caveman 开源项目:一个让 Claude Code 用「穴居人语言」说话的 skill,砍掉 75% Token 消耗同时保持 100% 技术准确率。
Claude Code
Token优化
AI编程
Prompt Engineering
LLM效率
开源工具
程序员工具
代码审查
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
27
28
29
30
31
...
39
下一页