程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
编程
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
2026-04-11 10:24:48 +0800 CST
view 736
深度解析 Apple Silicon 上的视觉语言模型推理引擎 MLX-VLM,涵盖架构设计、模型支持、性能优化与实战部署。
Apple Silicon
MLX
视觉语言模型
VLM
Mac本地AI
多模态推理
你睡觉AI在训练:Karpathy AutoResearch如何让AI自主优化GPT模型
编程
你睡觉AI在训练:Karpathy AutoResearch如何让AI自主优化GPT模型
2026-04-11 10:54:43 +0800 CST
view 450
深入解析Karpathy开源的AutoResearch框架,探讨AI自主训练循环的工程实现与研究范式转变
AI
Karpathy
AutoML
LLM
GitHub
GPU白嫖指南:Karpathy AutoResearch把深度学习调参变成AI托管服务
编程
GPU白嫖指南:Karpathy AutoResearch把深度学习调参变成AI托管服务
2026-04-11 10:55:13 +0800 CST
view 477
深入解析Karpathy开源的AutoResearch框架,探讨AI自主训练循环的工程实现与研究范式转变
AI
Karpathy
AutoML
LLM
GitHub
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
编程
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
2026-05-01 04:35:06 +0800 CST
view 380
GuppyLM是开源教育项目,870万参数小鱼角色扮演模型,5分钟Colab训练,覆盖数据生成到ONNX部署全流程,适合LLM初学者。
LLM
深度学习
开源
教学
Transformer
AI Scientist-v2 深度解析:当 AI 第一次独立完成顶会论文并通过同行评审
编程
AI Scientist-v2 深度解析:当 AI 第一次独立完成顶会论文并通过同行评审
2026-04-11 11:46:16 +0800 CST
view 813
AI Scientist-v2 是 Sakana AI 发布的自动化科研论文生成系统,能端到端完成从想法到顶会论文的全流程。本文从程序员视角深入剖析其技术架构、Agentic Tree Search 机制与代码实现,并探讨其对科研和开发者的真实影响。
AI Agent
科研自动化
LLM
机器学习
Nature
MoneyPrinterTurbo 深度实战:用 AI 大模型一键生成高清短视频——从 LLM 调度策略到批量视频生产的工程化完全指南(2026)
编程
MoneyPrinterTurbo 深度实战:用 AI 大模型一键生成高清短视频——从 LLM 调度策略到批量视频生产的工程化完全指南(2026)
2026-06-02 19:44:20 +0800 CST
view 566
MoneyPrinterTurbo 深度实战,详解用 AI 大模型一键生成高清短视频的完整工程化方案,涵盖 LLM 调度、素材检索、TTS 配音、FFmpeg 合成与批量生产优化。
AI视频生成
LLM应用
Python实战
短视频自动化
FFmpeg
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
编程
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
2026-05-17 01:50:10 +0800 CST
view 305
Agent-fox是一个基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图,支持自然语言测试、自动元素定位、自愈机制等核心功能。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
编程
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
2026-05-17 01:50:54 +0800 CST
view 371
Agent-fox是基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图。核心特性包括:自然语言解析引擎(NL Parser)、多策略融合元素定位(Smart Locator)、数据准备智能体(Data Preparation Agent)和自愈恢复机制。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM,测试框架
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
2026-06-17 07:55:50 +0800 CST
view 170
Google开源DiffusionGemma:基于离散文本扩散的26B MoE模型,并行去噪实现4倍推理加速,双向注意力天然支持代码补全与行内编辑
DiffusionGemma
LLM
扩散模型
推理加速
MoE
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 1580
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
编程
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
2026-06-02 21:19:20 +0800 CST
view 1242
Headroom 是专为 LLM 设计的通用压缩层,以 Library、Proxy、MCP Server 三种形态存在,在信息不丢失的前提下把 Token 消耗砍掉 60-95%。本文从信息论底层原理讲起,完整拆解四层压缩管线,结合真实代码实战演示接入方式。
LLM
Token优化
GitHub Trending
Python
RAG
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
编程
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
2026-06-02 22:14:57 +0800 CST
view 311
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
LCLM 深度实战:当「潜在上下文」颠覆大模型记忆困境——从 8.8 倍速提升到工业级部署的完整指南(2026)
编程
LCLM 深度实战:当「潜在上下文」颠覆大模型记忆困境——从 8.8 倍速提升到工业级部署的完整指南(2026)
2026-06-17 08:57:22 +0800 CST
view 186
深入解析2026年LCLM潜在上下文语言模型,8.8倍速度提升背后的技术原理与工业级部署实战,含完整代码示例与性能对比。
大模型
上下文压缩
KV缓存
LCLM
Transformer
AI优化
推理加速
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
编程
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
2026-05-11 09:52:48 +0800 CST
view 491
智谱AI发布GLM-5V-Turbo多模态编程基座模型,从预训练阶段原生融合视觉与语言,在Design2Code基准测试中以94.8分超越所有竞品。本文深度解析CogViT视觉编码器、MMTP多模态多Token预测、多任务RL优化等技术细节,以及如何用API接入实现从设计稿到可运行代码的完整工作流。
GLM-5V-Turbo
视觉编程
Design2Code
多模态
CogViT
MMTP
智谱AI
AI编程
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
编程
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
2026-06-02 22:15:17 +0800 CST
view 411
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
当「潜在上下文」颠覆大模型记忆困境:LCLM 8.8 倍速提升完整拆解与工业部署指南(2026)
编程
当「潜在上下文」颠覆大模型记忆困境:LCLM 8.8 倍速提升完整拆解与工业部署指南(2026)
2026-06-17 08:57:46 +0800 CST
view 189
深入解析2026年LCLM潜在上下文语言模型,8.8倍速度提升背后的技术原理与工业级部署实战,含完整代码示例与性能对比。
大模型
上下文压缩
KV缓存
LCLM
Transformer
AI优化
推理加速
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
编程
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
2026-05-23 20:00:37 +0800 CST
view 287
深度剖析 Unsloth 如何通过手写 Triton 内核、智能显存管理和 LoRA/QLoRA 优化,实现训练速度 2-5 倍提升、显存占用降低 70% 的技术奇迹。
LLM
微调
Unsloth
LoRA
深度学习
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
编程
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
2026-06-02 23:44:03 +0800 CST
view 371
Microsoft 开源的 MarkItDown 在 2026 年引爆 AI 工程圈。本文从源码级架构解析、多格式解析引擎、与 LLM 工具链的集成实战、性能优化到生产级 RAG 管道,全面拆解这款改变 AI 工程范式的工具。
Microsoft
MarkItDown
Markdown
LLM
RAG
Python
文档解析
AI工程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
编程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
2026-06-11 15:20:19 +0800 CST
view 342
Netflix工程师开源的AI上下文压缩工具Headroom,能在保持答案质量的前提下将Token消耗压缩60-95%,累计节省70万美元成本。本文深度剖析其架构设计、CCR可逆机制、跨Agent记忆共享与生产级集成实践。
AI编程
Token压缩
上下文管理
LLM优化
OpenSource
OctaFuse Gateway:统一管理Coding Plan/Token Plan的开源AI网关,个人SaaS都能用
编程
OctaFuse Gateway:统一管理Coding Plan/Token Plan的开源AI网关,个人SaaS都能用
2026-06-22 21:00:01 +0800 CST
view 133
OctaFuse Gateway开源AI网关,把Provider、模型路由、API Key、用户、预算、用量审计、财务记账和管理后台放在一起。个人用可统一Coding Plan/Token Plan入口;做SaaS可变成LLM服务底座。支持OpenAI/Anthropic/Gemini多协议,Provider Key池统一调度多套额度,三层成本口径(metered/standard/charged),自带Admin后台+Playground+Simulator。
OctaFuse
AI网关
开源
LLM管理
多模型路由
SaaS
计费审计
Provider Key池
Python 工具链的 Rust 化革命:从 uv、Ruff 到 LiteLLM——当 Rust 吃掉 Python 的工具生态
编程
Python 工具链的 Rust 化革命:从 uv、Ruff 到 LiteLLM——当 Rust 吃掉 Python 的工具生态
2026-06-30 14:43:40 +0800 CST
view 33
深度解析Python工具链的Rust化革命:从uv的包管理、Ruff的静态分析到LiteLLM的AI网关迁移,万字长文剖析Rust如何以10-100倍的性能优势重塑Python开发生态
Rust
Python
uv
Ruff
LiteLLM
Polars
性能优化
包管理
Pydantic
Python 工具链 Rust 化深度解析:从 uv、Ruff 到 LiteLLM——当系统级语言重塑 Python 开发体验
编程
Python 工具链 Rust 化深度解析:从 uv、Ruff 到 LiteLLM——当系统级语言重塑 Python 开发体验
2026-06-30 14:44:22 +0800 CST
view 43
深度解析Python工具链的Rust化革命:从uv的包管理、Ruff的静态分析到LiteLLM的AI网关迁移,万字长文剖析Rust如何以10-100倍的性能优势重塑Python开发生态
Rust
Python
uv
Ruff
LiteLLM
Polars
性能优化
包管理
Pydantic
Open Notebook 深度实战:当开源替代方案击败 Google Notebook LM——从多模态RAG到自托管部署的生产级完全指南(2026)【上】
编程
Open Notebook 深度实战:当开源替代方案击败 Google Notebook LM——从多模态RAG到自托管部署的生产级完全指南(2026)【上】
2026-06-11 16:20:00 +0800 CST
view 231
Open Notebook 是 Google Notebook LM 的开源替代方案,支持18+ AI模型、多模态内容处理、播客生成。本文上篇深度剖析项目背景、架构设计与核心功能实现。
Open Notebook
Notebook LM 替代品
RAG
多模态
自托管
AI笔记工具
Rust 正在重塑 Python 的工具链:深入解析 uv、Ruff 与 LiteLLM 的架构革命与 100 倍性能提升
编程
Rust 正在重塑 Python 的工具链:深入解析 uv、Ruff 与 LiteLLM 的架构革命与 100 倍性能提升
2026-06-30 14:45:17 +0800 CST
view 36
深度解析Python工具链的Rust化革命:从uv的包管理、Ruff的静态分析到LiteLLM的AI网关迁移,万字长文剖析Rust如何以10-100倍的性能优势重塑Python开发生态
Rust
Python
uv
Ruff
LiteLLM
Polars
性能优化
包管理
Pydantic
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
21
22
23
24
25
...
28
下一页