程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
编程
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
2026-05-10 00:41:20 +0800 CST
view 345
Docker 27 Orion深度解析:GPU拓扑感知调度与PCIe/NVLink自动绑定、NUMA内存带宽限制、dockerd-scheduler AI调度代理、docker ai run零配置LLM部署、Dockerfile.ai模型封装语法、OOM Killer五步防御、cgroups v2集成与生产环境避坑指南
Docker
容器化
GPU调度
NUMA
AI推理
LLM
docker-compose
cgroups
Dockerfile
NVIDIA
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
编程
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
2026-06-16 16:46:05 +0800 CST
view 282
深度解析 2026 年 Apple Silicon 本地大模型推理技术栈:从 llama.cpp 量化体系到 oMLX 分层 KV 缓存架构,从 MTP 加速到 CoreAI 全栈指南,包含实测 Benchmark 与生产级部署方案。
Apple Silicon
MLX
llama.cpp
oMLX
MTP
本地大模型
量化
本地推理
OpenAI Jalapeño 深度解析:9个月流片的AI推理芯片如何把成本砍掉一半,英伟达GPU帝国的裂痕
编程
OpenAI Jalapeño 深度解析:9个月流片的AI推理芯片如何把成本砍掉一半,英伟达GPU帝国的裂痕
2026-06-29 21:14:35 +0800 CST
view 22
深度解析OpenAI首款自研AI推理芯片Jalapeño:9个月流片、推理成本降低50%、每瓦性能超越英伟达GPU。从架构设计、内存优化、数据流优化到产业链合作,全方位解读这款芯片如何重塑AI推理市场格局。
OpenAI
Jalapeño
AI芯片
ASIC
推理芯片
英伟达
GPU
博通
Broadcom
LLM推理
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
编程
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
2026-06-11 00:19:05 +0800 CST
view 225
全面解析 llama.cpp 推理引擎,从 GGUF 格式、量化原理、架构设计到跨平台部署,提供生产级代码实战和性能优化指南。
llama.cpp
GGUF
量化
端侧推理
大语言模型
Andrej Karpathy 的 CLAUDE.md 工程规范深度解析:AI 辅助编码的四大原则与生产级实践
编程
Andrej Karpathy 的 CLAUDE.md 工程规范深度解析:AI 辅助编码的四大原则与生产级实践
2026-06-30 00:42:36 +0800 CST
view 24
深度解析 Andrej Karpathy 的 CLAUDE.md 四大原则:先思考后编码、简洁优先、精准修改、目标驱动,附带完整代码实战与生产级落地方案。
Andrej Karpathy
CLAUDE.md
AI辅助编码
提示词工程
LLM
AI Agent
系统提示
Python
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
编程
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
2026-06-16 18:52:52 +0800 CST
view 264
Google DeepMind联合NVIDIA发布DiffusionGemma——基于离散文本扩散的实验性开源模型。本文深入解读26B MoE架构、双向注意力机制、本地推理4倍加速原理,附完整代码示例和部署实战。
Google
DiffusionGemma
扩散模型
MoE
开源LLM
本地推理
AI推理加速
Sage-Wiki 深度解析:当知识管理从「手动整理」变成「LLM自动编译」
编程
Sage-Wiki 深度解析:当知识管理从「手动整理」变成「LLM自动编译」
2026-04-10 06:03:55 +0800 CST
view 984
sage-wiki 是基于 Andrej Karpathy 想法实现的 LLM-compiled 个人知识库,支持15种格式自动编译成互链 Wiki,MCP 接口让 AI Agent 访问你的知识。
sage-wiki
知识管理
LLM
Go
编译器
Karpathy
MCP
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
编程
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
2026-04-19 17:14:36 +0800 CST
view 597
深度解析微软开源工具 MarkItDown,10.8万星GitHub热门项目,解决 LLM 文档处理的世纪难题。支持20+格式一键转Markdown,MCP协议与AI工具深度集成。
MarkItDown
Markdown
Python
微软
LLM
MCP
RAG
文档处理
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
2026-06-11 03:16:24 +0800 CST
view 223
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
你睡觉,AI 干活:Karpathy 的 AutoResearch 如何让大模型自己学会训练自己
编程
你睡觉,AI 干活:Karpathy 的 AutoResearch 如何让大模型自己学会训练自己
2026-04-19 18:47:36 +0800 CST
view 614
深入解析 Andrej Karpathy 的 AutoResearch 开源项目,揭示其让 AI agent 自主修改训练代码、在真实执行中验证改进的核心机制,探讨对算法工程师职业的影响。
AI研究
机器学习
AutoML
LLM训练
Andrej Karpathy
GitHub开源
自动化调参
Python
研究效率
Agent
stop-slop 深度实战:让 AI 写作告别"机器味"——从 AI Tells 识别到零痕迹输出的完全指南(2026)
编程
stop-slop 深度实战:让 AI 写作告别"机器味"——从 AI Tells 识别到零痕迹输出的完全指南(2026)
2026-06-02 15:55:21 +0800 CST
view 454
深度解析 stop-slop 项目,系统性移除 AI 写作痕迹的实战指南,涵盖规则体系、评分标准、实战集成与完整代码示例。
AI写作
stop-slop
LLM
提示工程
技术写作
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
编程
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
2026-06-11 03:17:21 +0800 CST
view 355
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
Onyx 深度解析:当开源AI平台把「企业级能力」变成「一键部署」
编程
Onyx 深度解析:当开源AI平台把「企业级能力」变成「一键部署」
2026-04-10 07:36:00 +0800 CST
view 396
Onyx 是 26k+ stars 的开源AI平台,提供 Agentic RAG、Deep Research、Custom Agents、MCP 等企业级能力。本文深度解析其架构设计、核心功能和部署实战,是私有AI部署的标准答案。
Onyx
开源AI
RAG
企业AI
LLM平台
LLM 驱动的自动化漏洞挖掘:从 AIxVuln 到 Wiz 实战,多 Agent 如何重塑安全攻防体系
编程
LLM 驱动的自动化漏洞挖掘:从 AIxVuln 到 Wiz 实战,多 Agent 如何重塑安全攻防体系
2026-05-23 06:17:17 +0800 CST
view 295
深入解析 LLM 驱动的自动化漏洞挖掘技术,从 AIxVuln 多 Agent 架构到 Wiz 发现 GitHub CVE-2026-3854 的实战案例,覆盖架构设计、代码实战、性能优化与安全边界
AI安全
漏洞挖掘
LLM
多Agent
Docker沙箱
Wiz
GitHub
CVE
Rust在前端工具链的崛起:从Rolldown到Oxc,2026年生态全景
编程
Rust在前端工具链的崛起:从Rolldown到Oxc,2026年生态全景
2026-04-19 21:15:51 +0800 CST
view 620
深度解析2026年Rust在前端工具链的崛起:从Rolldown到Oxc的性能革命,涵盖Vite 8.0统一架构、Rspack替代Webpack、Oxc Linter极速代码检查等核心话题
Rust
前端工具链
Rolldown
Oxc
Rspack
Vite
OpenClaw 深度解析:重塑个人 AI 助手范式的开源架构革命——从 Gateway 到 Skill 生态的全链路技术拆解
编程
OpenClaw 深度解析:重塑个人 AI 助手范式的开源架构革命——从 Gateway 到 Skill 生态的全链路技术拆解
2026-06-30 03:44:16 +0800 CST
view 40
深度解析OpenClaw个人AI助手框架:从Gateway控制面、多通道消息路由、Skill技能生态、MCP协议集成、安全模型、会话管理到生产级部署,附完整代码示例与架构决策分析。
OpenClaw
个人AI助手
开源AI
AI Agent
MCP协议
Gateway架构
Skill生态
多通道接入
本地部署
AI自动化
【深度长文】JavaScript正在被Rust取代:2026年前端构建工具链革命性演进
编程
【深度长文】JavaScript正在被Rust取代:2026年前端构建工具链革命性演进
2026-04-19 21:16:20 +0800 CST
view 518
深度解析2026年Rust在前端工具链的崛起:从Rolldown到Oxc的性能革命,涵盖Vite 8.0统一架构、Rspack替代Webpack、Oxc Linter极速代码检查等核心话题
Rust
前端工具链
Rolldown
Oxc
Rspack
Vite
Ollama 深度实战:当本地大模型部署成为事实标准——从一行命令跑 Llama/Qwen/DeepSeek 到生产级 API 兼容与多语言接入完全指南(2026)
编程
Ollama 深度实战:当本地大模型部署成为事实标准——从一行命令跑 Llama/Qwen/DeepSeek 到生产级 API 兼容与多语言接入完全指南(2026)
2026-06-11 05:47:01 +0800 CST
view 280
本文深入讲解Ollama的原理、实战部署、性能优化,帮助开发者快速掌握本地大模型部署能力
Ollama
本地大模型
AI部署
Go语言
Python
编程
MarkItDown 深度实战:当微软用 Python 把「文档地狱」变成 Markdown 乐园——从多格式解析到 RAG 知识库落地的生产级完全指南(2026)
2026-06-16 23:52:04 +0800 CST
view 172
微软开源MarkItDown深度实战:从多格式文档解析到RAG知识库落地的完全指南,涵盖PDF/Word/Excel/PPT转换、LangChain/LlamaIndex集成、性能优化与安全防护
MarkItDown
Python
RAG
文档转换
Markdown
LLM
知识库
微软
AI Agent
LangChain
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率暴力破解 90 分钟长语音合成——开源语音 AI 的技术革命
编程
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率暴力破解 90 分钟长语音合成——开源语音 AI 的技术革命
2026-05-10 23:20:20 +0800 CST
view 503
深度解析微软开源语音 AI 项目 VibeVoice 的技术架构——从 7.5Hz 超低帧率分词器到 Next-Token Diffusion 框架,一次性处理 90 分钟多说话人音频的革命性突破。
VibeVoice
语音AI
TTS
ASR
微软
开源模型
LLM
扩散模型
你睡觉AI在训练:Karpathy AutoResearch如何让AI自主优化GPT模型
编程
你睡觉AI在训练:Karpathy AutoResearch如何让AI自主优化GPT模型
2026-04-11 10:54:43 +0800 CST
view 444
深入解析Karpathy开源的AutoResearch框架,探讨AI自主训练循环的工程实现与研究范式转变
AI
Karpathy
AutoML
LLM
GitHub
GPU白嫖指南:Karpathy AutoResearch把深度学习调参变成AI托管服务
编程
GPU白嫖指南:Karpathy AutoResearch把深度学习调参变成AI托管服务
2026-04-11 10:55:13 +0800 CST
view 469
深入解析Karpathy开源的AutoResearch框架,探讨AI自主训练循环的工程实现与研究范式转变
AI
Karpathy
AutoML
LLM
GitHub
RedFox:一个 API Key 打通全网自媒体数据,45 个开源 Agent Skill 免费部署
编程
RedFox:一个 API Key 打通全网自媒体数据,45 个开源 Agent Skill 免费部署
2026-06-11 10:35:17 +0800 CST
view 1860
RedFox(红狐数据)把自媒体数据做成标准REST API和开源Agent Skill,一个API Key打通抖音、小红书、公众号等11个主流平台,45个开源Skill让AI编程助手直接调用,省掉90%数据采集维护成本。
RedFox
自媒体数据
API
Agent Skill
Codex
Claude Code
数据采集
抖音
小红书
公众号
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
编程
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
2026-05-01 04:35:06 +0800 CST
view 374
GuppyLM是开源教育项目,870万参数小鱼角色扮演模型,5分钟Colab训练,覆盖数据生成到ONNX部署全流程,适合LLM初学者。
LLM
深度学习
开源
教学
Transformer
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
20
21
22
23
24
...
70
下一页