程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
编程
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
2026-04-19 17:14:36 +0800 CST
view 515
深度解析微软开源工具 MarkItDown,10.8万星GitHub热门项目,解决 LLM 文档处理的世纪难题。支持20+格式一键转Markdown,MCP协议与AI工具深度集成。
MarkItDown
Markdown
Python
微软
LLM
MCP
RAG
文档处理
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
2026-06-11 03:16:24 +0800 CST
view 137
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
你睡觉,AI 干活:Karpathy 的 AutoResearch 如何让大模型自己学会训练自己
编程
你睡觉,AI 干活:Karpathy 的 AutoResearch 如何让大模型自己学会训练自己
2026-04-19 18:47:36 +0800 CST
view 525
深入解析 Andrej Karpathy 的 AutoResearch 开源项目,揭示其让 AI agent 自主修改训练代码、在真实执行中验证改进的核心机制,探讨对算法工程师职业的影响。
AI研究
机器学习
AutoML
LLM训练
Andrej Karpathy
GitHub开源
自动化调参
Python
研究效率
Agent
obra/superpowers 深度实战:用工程纪律驯服 AI 编程 Agent——从 Prompt 工程到 Process 工程的范式转移
编程
obra/superpowers 深度实战:用工程纪律驯服 AI 编程 Agent——从 Prompt 工程到 Process 工程的范式转移
2026-05-23 05:45:11 +0800 CST
view 252
深度解析 GitHub 20万星开源项目 obra/superpowers,探讨如何用工程纪律(TDD、任务拆解、代码审查)驯服 AI 编程 Agent,从 Prompt 工程到 Process 工程的范式转移。
AI编程
Agent框架
软件工程
LLM
GitHub开源
stop-slop 深度实战:让 AI 写作告别"机器味"——从 AI Tells 识别到零痕迹输出的完全指南(2026)
编程
stop-slop 深度实战:让 AI 写作告别"机器味"——从 AI Tells 识别到零痕迹输出的完全指南(2026)
2026-06-02 15:55:21 +0800 CST
view 320
深度解析 stop-slop 项目,系统性移除 AI 写作痕迹的实战指南,涵盖规则体系、评分标准、实战集成与完整代码示例。
AI写作
stop-slop
LLM
提示工程
技术写作
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
编程
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
2026-06-11 03:17:21 +0800 CST
view 152
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
Onyx 深度解析:当开源AI平台把「企业级能力」变成「一键部署」
编程
Onyx 深度解析:当开源AI平台把「企业级能力」变成「一键部署」
2026-04-10 07:36:00 +0800 CST
view 332
Onyx 是 26k+ stars 的开源AI平台,提供 Agentic RAG、Deep Research、Custom Agents、MCP 等企业级能力。本文深度解析其架构设计、核心功能和部署实战,是私有AI部署的标准答案。
Onyx
开源AI
RAG
企业AI
LLM平台
LLM 驱动的自动化漏洞挖掘:从 AIxVuln 到 Wiz 实战,多 Agent 如何重塑安全攻防体系
编程
LLM 驱动的自动化漏洞挖掘:从 AIxVuln 到 Wiz 实战,多 Agent 如何重塑安全攻防体系
2026-05-23 06:17:17 +0800 CST
view 222
深入解析 LLM 驱动的自动化漏洞挖掘技术,从 AIxVuln 多 Agent 架构到 Wiz 发现 GitHub CVE-2026-3854 的实战案例,覆盖架构设计、代码实战、性能优化与安全边界
AI安全
漏洞挖掘
LLM
多Agent
Docker沙箱
Wiz
GitHub
CVE
60行CLAUDE.md,25K Stars:Karpathy揭示的LLM编程四大致命陷阱与工程解法
编程
60行CLAUDE.md,25K Stars:Karpathy揭示的LLM编程四大致命陷阱与工程解法
2026-04-19 23:44:59 +0800 CST
view 560
深度解析GitHub 25K Stars项目forrestchang/andrej-karpathy-skills,揭示LLM编程工具的四大系统性缺陷,详解Karpathy四大编码原则在工程实践中的落地方法。
Claude Code
LLM
AI编程
Karpathy
工程实践
编程
MarkItDown 深度实战:当微软用 Python 把「文档地狱」变成 Markdown 乐园——从多格式解析到 RAG 知识库落地的生产级完全指南(2026)
2026-06-16 23:52:04 +0800 CST
view 41
微软开源MarkItDown深度实战:从多格式文档解析到RAG知识库落地的完全指南,涵盖PDF/Word/Excel/PPT转换、LangChain/LlamaIndex集成、性能优化与安全防护
MarkItDown
Python
RAG
文档转换
Markdown
LLM
知识库
微软
AI Agent
LangChain
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率暴力破解 90 分钟长语音合成——开源语音 AI 的技术革命
编程
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率暴力破解 90 分钟长语音合成——开源语音 AI 的技术革命
2026-05-10 23:20:20 +0800 CST
view 421
深度解析微软开源语音 AI 项目 VibeVoice 的技术架构——从 7.5Hz 超低帧率分词器到 Next-Token Diffusion 框架,一次性处理 90 分钟多说话人音频的革命性突破。
VibeVoice
语音AI
TTS
ASR
微软
开源模型
LLM
扩散模型
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
编程
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
2026-05-23 11:16:44 +0800 CST
view 247
深度解析UC San Diego Z Lab提出的DFlash(Block Diffusion for Flash Speculative Decoding),详解块扩散草稿模型如何突破自回归瓶颈,在Qwen3-8B上实现6倍无损加速的架构原理、训练方法与生产级实战代码
LLM推理,投机解码,块扩散模型,大模型加速,DFlash,Speculative Decoding,UC San Diego,PyTorch,深度学习,AI推理优化
你睡觉AI在训练:Karpathy AutoResearch如何让AI自主优化GPT模型
编程
你睡觉AI在训练:Karpathy AutoResearch如何让AI自主优化GPT模型
2026-04-11 10:54:43 +0800 CST
view 384
深入解析Karpathy开源的AutoResearch框架,探讨AI自主训练循环的工程实现与研究范式转变
AI
Karpathy
AutoML
LLM
GitHub
GPU白嫖指南:Karpathy AutoResearch把深度学习调参变成AI托管服务
编程
GPU白嫖指南:Karpathy AutoResearch把深度学习调参变成AI托管服务
2026-04-11 10:55:13 +0800 CST
view 402
深入解析Karpathy开源的AutoResearch框架,探讨AI自主训练循环的工程实现与研究范式转变
AI
Karpathy
AutoML
LLM
GitHub
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
编程
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
2026-05-01 04:35:06 +0800 CST
view 307
GuppyLM是开源教育项目,870万参数小鱼角色扮演模型,5分钟Colab训练,覆盖数据生成到ONNX部署全流程,适合LLM初学者。
LLM
深度学习
开源
教学
Transformer
Hermes Agent 深度实战:Nous Research 开源自进化 AI Agent——从闭环学习到生产级部署的完整指南
编程
Hermes Agent 深度实战:Nous Research 开源自进化 AI Agent——从闭环学习到生产级部署的完整指南
2026-05-23 13:15:28 +0800 CST
view 218
Hermes Agent 是由 Nous Research 开源的自进化 AI Agent 框架,内置学习闭环,能从经验中自动创建技能、持久化记忆、跨会话召回,越用越强。本文深度解析其架构设计、核心实现与生产级部署实践。
AI Agent
自进化
Nous Research
Python
LLM
AI Scientist-v2 深度解析:当 AI 第一次独立完成顶会论文并通过同行评审
编程
AI Scientist-v2 深度解析:当 AI 第一次独立完成顶会论文并通过同行评审
2026-04-11 11:46:16 +0800 CST
view 706
AI Scientist-v2 是 Sakana AI 发布的自动化科研论文生成系统,能端到端完成从想法到顶会论文的全流程。本文从程序员视角深入剖析其技术架构、Agentic Tree Search 机制与代码实现,并探讨其对科研和开发者的真实影响。
AI Agent
科研自动化
LLM
机器学习
Nature
MoneyPrinterTurbo 深度实战:用 AI 大模型一键生成高清短视频——从 LLM 调度策略到批量视频生产的工程化完全指南(2026)
编程
MoneyPrinterTurbo 深度实战:用 AI 大模型一键生成高清短视频——从 LLM 调度策略到批量视频生产的工程化完全指南(2026)
2026-06-02 19:44:20 +0800 CST
view 405
MoneyPrinterTurbo 深度实战,详解用 AI 大模型一键生成高清短视频的完整工程化方案,涵盖 LLM 调度、素材检索、TTS 配音、FFmpeg 合成与批量生产优化。
AI视频生成
LLM应用
Python实战
短视频自动化
FFmpeg
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
编程
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
2026-05-17 01:50:10 +0800 CST
view 242
Agent-fox是一个基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图,支持自然语言测试、自动元素定位、自愈机制等核心功能。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM
Stanford CS336 深度实战:从零实现大语言模型——数据清洗、Transformer 架构、FlashAttention 系统优化到 RL 对齐的完全指南(2026)
编程
Stanford CS336 深度实战:从零实现大语言模型——数据清洗、Transformer 架构、FlashAttention 系统优化到 RL 对齐的完全指南(2026)
2026-06-02 20:14:38 +0800 CST
view 173
Stanford CS336 课程深度解读:从零实现大语言模型,覆盖 Tokenizer、Transformer、FlashAttention-2、FSDP 分布式训练、Scaling Law、Common Crawl 数据清洗去重、SFT 与 GRPO 对齐,配完整代码示例。
LLM
Transformer
Stanford CS336
FlashAttention
PyTorch
AI工程
分布式训练
强化学习
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
编程
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
2026-05-17 01:50:54 +0800 CST
view 280
Agent-fox是基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图。核心特性包括:自然语言解析引擎(NL Parser)、多策略融合元素定位(Smart Locator)、数据准备智能体(Data Preparation Agent)和自愈恢复机制。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM,测试框架
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
2026-06-17 07:55:50 +0800 CST
view 32
Google开源DiffusionGemma:基于离散文本扩散的26B MoE模型,并行去噪实现4倍推理加速,双向注意力天然支持代码补全与行内编辑
DiffusionGemma
LLM
扩散模型
推理加速
MoE
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
编程
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
2026-06-02 21:19:20 +0800 CST
view 1055
Headroom 是专为 LLM 设计的通用压缩层,以 Library、Proxy、MCP Server 三种形态存在,在信息不丢失的前提下把 Token 消耗砍掉 60-95%。本文从信息论底层原理讲起,完整拆解四层压缩管线,结合真实代码实战演示接入方式。
LLM
Token优化
GitHub Trending
Python
RAG
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
编程
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
2026-06-02 21:45:53 +0800 CST
view 279
Hermes WebUI 今日飙升 1725 星。本文深度拆解其架构设计、SSE流式传输机制、多模型路由策略、工具调用可视化实现,以及从本地部署到生产级优化的完整指南。
Hermes
WebUI
SSE
LLM
Agent
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
...
16
下一页