程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
编程
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
2026-06-16 06:47:47 +0800 CST
view 255
MusaCoder是首个基于国产GPU完成全链路训练的代码大模型,在KernelBench上超越Claude Opus 4.7。从三阶段数据合成、多样性RFT到执行反馈RL,深度解析全栈训练方法论。
MusaCoder
GPU Kernel
摩尔线程
国产GPU
CUDA
MUSA
大模型
强化学习
KernelBench
代码大模型
AI Coding
深度学习
FastAI是一个基于PyTorch的深度学习库
综合
FastAI是一个基于PyTorch的深度学习库
2024-11-19 07:02:46 +0800 CST
view 1635
FastAI是一个基于PyTorch的深度学习库,旨在简化深度学习的使用。它提供简单易用的API和高性能的模型训练,支持计算机视觉、自然语言处理等多种应用。通过迁移学习,FastAI能够利用预训练模型提高训练效率。用户可以快速上手,轻松实现图像分类和情感分析等任务,是深度学习爱好者的理想选择。
深度学习
机器学习
人工智能
Python
TimesFM 2.5 深度解析:Google 如何用 200M 参数的时间序列基础模型颠覆传统预测范式
编程
TimesFM 2.5 深度解析:Google 如何用 200M 参数的时间序列基础模型颠覆传统预测范式
2026-04-19 19:46:34 +0800 CST
view 632
Google TimesFM 2.5 时间序列基础模型深度解析:Patched Decoder 架构、XReg 协变量机制、LoRA 微调实战、BigQuery ML 部署,从零样本预测到生产落地全链路指南
TimesFM
时间序列
机器学习
Google
深度学习
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
编程
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
2026-05-12 00:20:07 +0800 CST
view 477
深度解析TabPFN如何用Transformer架构重写表格数据机器学习范式:从合成数据预训练、先验数据拟合原理、2.8秒vs4小时性能对比,到TabPFN-2.5的10万行处理能力与SAP收购战略意义,附完整代码示例
TabPFN,表格数据,Transformer,AutoML,机器学习,XGBoost,PriorLabs,深度学习,基础模型,Python
Easy-AI库,旨在帮助Python开发者轻松入门人工智能开发
综合
Easy-AI库,旨在帮助Python开发者轻松入门人工智能开发
2024-11-17 16:15:26 +0800 CST
view 1895
本文介绍了Easy-AI库,旨在帮助Python开发者轻松入门人工智能开发。内容涵盖了Easy-AI的安装、基本用法、高级特性及实际案例,展示了如何使用该库进行数据预处理、模型定义、训练和评估。Easy-AI的简洁API使得即使是初学者也能快速构建功能完善的AI系统。
人工智能
Python编程
机器学习
深度学习
开发工具
WebGen-R1 深度实战:7B 小模型如何用强化学习独立建站,碾压 DeepSeek-R1
编程
WebGen-R1 深度实战:7B 小模型如何用强化学习独立建站,碾压 DeepSeek-R1
2026-05-05 11:33:45 +0800 CST
view 426
香港科技大学与阿里巴巴联合研究 WebGen-R1,用强化学习训练 7B 小模型独立生成完整网站,功能成功率超越 DeepSeek-R1,美学评分吊打 GPT-5。
AI
强化学习
代码生成
WebGen-R1
深度学习
Karpathy AutoResearch 深度解析:630行代码如何让AI学会「自己做研究」
编程
Karpathy AutoResearch 深度解析:630行代码如何让AI学会「自己做研究」
2026-04-23 10:51:04 +0800 CST
view 635
深入解析Andrej Karpathy的开源项目AutoResearch,630行Python代码如何实现AI自主研究,探讨约束驱动的设计哲学与工程实践
Python
机器学习
AI Agent
深度学习
自动优化
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
编程
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
2026-05-14 01:14:23 +0800 CST
view 447
ReAct框架是AI Agent的核心架构范式,通过Thought-Action-Observation循环实现智能推理与行动。本文深度解析其从字符串解析到原生Tool Calling的演进历程、LangGraph状态机架构、代码实战及最佳实践。
ReAct,AI Agent,TAO循环,Function Calling,LangGraph,大语言模型,深度学习,Python,机器学习,智能体
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
综合
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
2024-11-18 19:34:19 +0800 CST
view 1966
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程。它提供多种工具,如集成梯度、SaliencyMap和DeepLift,帮助开发者理解模型对输入数据的依赖关系和特征重要性。Captum提升了模型的透明度和可解释性,适用于模型审查、优化和调试等场景。
深度学习
模型解释
机器学习
AI-Scientist-v2:自动化科研的全流程架构拆解与源码解读
编程
AI-Scientist-v2:自动化科研的全流程架构拆解与源码解读
2026-06-28 13:46:22 +0800 CST
view 107
深入拆解AI-Scientist-v2的完整技术架构,从工程视角分析多智能体协同、树搜索决策、视觉反馈闭环等核心设计,并提供快速部署指南。
AI-Agent
自动化科研
多智能体系统
树搜索算法
AI-Scientist
OpenAI
Claude
机器学习
深度学习
技术架构
字节跳动 DeerFlow 2.0 深度解析:46k Star 的超级智能体框架,让 AI 真正「动手做事」
编程
字节跳动 DeerFlow 2.0 深度解析:46k Star 的超级智能体框架,让 AI 真正「动手做事」
2026-04-28 13:55:13 +0800 CST
view 414
深度解析字节跳动开源的 DeerFlow 2.0 超级智能体框架,46k Star 的核心技术架构、LangGraph 状态机原理、代码实战与性能优化指南。
AI Agent
LangGraph
DeerFlow
字节跳动
多智能体
深度学习
ENPIRE框架深度解析:NVIDIA如何让AI Coding Agent在物理世界完成科研闭环
编程
ENPIRE框架深度解析:NVIDIA如何让AI Coding Agent在物理世界完成科研闭环
2026-06-29 08:43:25 +0800 CST
view 119
深度解析NVIDIA ENPIRE框架:让AI Coding Agent不仅能写代码,还能自主设计实验、部署到真实机器人、运行并迭代——完整科研闭环首次实现。含架构剖析、代码实战、性能评估。
NVIDIA
ENPIRE
AI Agent
机器人
具身智能
Python
深度学习
auto-deep-researcher-24x7 深度解析:当 AI 替你在深夜跑实验,科研终于变成「睡觉也能进步」的游戏
编程
auto-deep-researcher-24x7 深度解析:当 AI 替你在深夜跑实验,科研终于变成「睡觉也能进步」的游戏
2026-04-09 08:06:41 +0800 CST
view 671
深度解析 auto-deep-researcher-24x7:Leader-Worker 架构、零成本监控、双层记忆系统如何实现 /bin/zsh.08/天的 7×24 小时 AI 实验自动化
AI Agent
深度学习
实验自动化
MLOps
Python
Claude Code
Google TimesFM 深度解析:14K Star 的时间序列基础模型如何用 200M 参数颠覆零样本预测
编程
Google TimesFM 深度解析:14K Star 的时间序列基础模型如何用 200M 参数颠覆零样本预测
2026-04-28 18:22:55 +0800 CST
view 494
深度解析 Google TimesFM:200M 参数如何在 1000 亿时间点上预训练后实现零样本超越有监督模型,覆盖架构原理、代码实战、性能对比与生产部署完整指南。
AI大模型
时间序列预测
Google
TimesFM
零样本预测
深度学习
GitHub开源
预训练模型
DeepRare深度解析:当AI学会像医生一样"慢思考"——全球首个可溯源医疗智能体的技术架构与工程实践
编程
DeepRare深度解析:当AI学会像医生一样"慢思考"——全球首个可溯源医疗智能体的技术架构与工程实践
2026-04-19 10:47:48 +0800 CST
view 431
深度解析上海交大Nature论文DeepRare系统的技术架构,包括System 2慢思考机制、中枢-分身架构、知识图谱构建等核心技术的工程实现
AI
医疗
架构设计
深度学习
VibeVoice 深度解析:微软 45K Star 开源语音 AI,重新定义长音频处理范式
编程
VibeVoice 深度解析:微软 45K Star 开源语音 AI,重新定义长音频处理范式
2026-04-29 11:11:12 +0800 CST
view 378
深度解析微软开源语音AI框架VibeVoice:60分钟单次ASR、90分钟多说话人TTS、200ms实时语音合成,7.5Hz超低帧率Tokenizer+Next-Token Diffusion架构,45K Star项目技术全解析
VibeVoice
语音AI
ASR
TTS
微软
开源
深度学习
语音识别
语音合成
百度 Unlimited OCR 深度解析:R-SWA 如何把 KV Cache 从线性增长压成常数,端到端 OCR 的长文档革命
编程
百度 Unlimited OCR 深度解析:R-SWA 如何把 KV Cache 从线性增长压成常数,端到端 OCR 的长文档革命
2026-06-29 19:45:14 +0800 CST
view 59
深度解析百度开源的 Unlimited OCR:R-SWA 如何把 KV Cache 从线性增长压成常数,解决长文档 OCR 的失忆问题,OmniDocBench v1.6 刷新 SOTA 93.92%
Unlimited OCR
百度
OCR
端到端
长文档
R-SWA
开源
深度学习
文档解析
Markdown
微软 VibeVoice 深度实战:从 7.5Hz 超低帧率到 90 分钟长音频合成——下一代语音 AI 的架构革命与生产级实践
编程
微软 VibeVoice 深度实战:从 7.5Hz 超低帧率到 90 分钟长音频合成——下一代语音 AI 的架构革命与生产级实践
2026-05-23 01:45:11 +0800 CST
view 399
深度解析微软开源语音AI模型VibeVoice,涵盖7.5Hz超低帧率、90分钟长音频合成、300ms实时流式等核心技术
语音AI
VibeVoice
微软
TTS
ASR
深度学习
TinyGrad 深度解析:31K Star 的极简深度学习框架,为什么"小而可Hack"才是未来
编程
TinyGrad 深度解析:31K Star 的极简深度学习框架,为什么"小而可Hack"才是未来
2026-04-29 15:53:15 +0800 CST
view 440
深入剖析31K Star的TinyGrad框架:极简架构设计、IR编译器原理、延迟求值机制,以及为什么"小而可Hack"可能是深度学习框架的终极答案。
TinyGrad
深度学习
PyTorch
开源框架
AI
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 573
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
百度Unlimited OCR技术深度解析:R-SWA机制如何把KV Cache压成常数,3B模型刷新长文档OCR王座
编程
百度Unlimited OCR技术深度解析:R-SWA机制如何把KV Cache压成常数,3B模型刷新长文档OCR王座
2026-06-30 02:13:31 +0800 CST
view 74
百度Unlimited OCR技术深度解析:R-SWA机制如何把KV Cache压成常数,3B模型刷新长文档OCR王座
OCR
百度
深度学习
文档解析
R-SWA
HuggingFace ml-intern 深度解析:一个能读论文、训模型、推上线的 AI 工程师,从架构到源码的完整拆解
编程
HuggingFace ml-intern 深度解析:一个能读论文、训模型、推上线的 AI 工程师,从架构到源码的完整拆解
2026-05-01 03:24:14 +0800 CST
view 357
HuggingFace ml-intern 深度拆解:从 Agent Loop 架构到 Doom Loop 检测器,从 Research Sub-agent 到 ToolRouter,完整解析这个能自主完成论文研究、模型训练、云端部署的 AI 工程师
AI Agent
HuggingFace
ML
深度学习
Python
开源
HuggingFace ml-intern 深度解析:从架构到源码,拆解这个能读论文训模型推上线的AI工程师
编程
HuggingFace ml-intern 深度解析:从架构到源码,拆解这个能读论文训模型推上线的AI工程师
2026-05-01 03:24:43 +0800 CST
view 713
HuggingFace ml-intern 深度拆解:从 Agent Loop 架构到 Doom Loop 检测器,从 Research Sub-agent 到 ToolRouter,完整解析这个能自主完成论文研究、模型训练、云端部署的 AI 工程师
AI Agent
HuggingFace
ML
深度学习
Python
开源
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
编程
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
2026-05-23 11:16:44 +0800 CST
view 348
深度解析UC San Diego Z Lab提出的DFlash(Block Diffusion for Flash Speculative Decoding),详解块扩散草稿模型如何突破自回归瓶颈,在Qwen3-8B上实现6倍无损加速的架构原理、训练方法与生产级实战代码
LLM推理,投机解码,块扩散模型,大模型加速,DFlash,Speculative Decoding,UC San Diego,PyTorch,深度学习,AI推理优化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
7
下一页