程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Agent Lightning 深度解析:当微软说「零代码改动」就能让 AI Agent 持续进化
编程
Agent Lightning 深度解析:当微软说「零代码改动」就能让 AI Agent 持续进化
2026-04-10 06:32:45 +0800 CST
view 309
微软开源的 Agent Lightning 框架深度解析:零代码改动让 AI Agent 持续进化,支持强化学习、提示优化、监督微调,兼容 LangChain、AutoGen、CrewAI 等所有主流框架。
AI Agent
强化学习
微软
开源
Agent Lightning
机器学习
WebGen-R1 深度实战:7B 小模型如何用强化学习独立建站,碾压 DeepSeek-R1
编程
WebGen-R1 深度实战:7B 小模型如何用强化学习独立建站,碾压 DeepSeek-R1
2026-05-05 11:33:45 +0800 CST
view 173
香港科技大学与阿里巴巴联合研究 WebGen-R1,用强化学习训练 7B 小模型独立生成完整网站,功能成功率超越 DeepSeek-R1,美学评分吊打 GPT-5。
AI
强化学习
代码生成
WebGen-R1
深度学习
Agent Lightning 深度解析:微软如何用零代码改造让 AI Agent 实现自我进化
编程
Agent Lightning 深度解析:微软如何用零代码改造让 AI Agent 实现自我进化
2026-04-18 15:12:54 +0800 CST
view 276
深入剖析微软开源项目 Agent Lightning 的技术架构,详解零代码接入、多框架兼容、强化学习训练等核心特性
AI Agent
强化学习
LangChain
AutoGen
微软
开源
Agent Lightning 深度解析:零代码如何让任何框架的 AI Agent 实现自我进化
编程
Agent Lightning 深度解析:零代码如何让任何框架的 AI Agent 实现自我进化
2026-04-18 15:13:12 +0800 CST
view 262
深入剖析微软开源项目 Agent Lightning 的技术架构,详解零代码接入、多框架兼容、强化学习训练等核心特性
AI Agent
强化学习
LangChain
AutoGen
微软
开源
Agent Lightning 深度解析:微软开源 AI Agent 训练框架——零代码改动,让任何 AI Agent 学会「自我进化」
编程
Agent Lightning 深度解析:微软开源 AI Agent 训练框架——零代码改动,让任何 AI Agent 学会「自我进化」
2026-05-16 03:14:41 +0800 CST
view 150
微软研究院开源 Agent Lightning:零代码改动训练任何 AI Agent,支持 RL/APO/SFT,已验证 128 GPU 大规模训练。
AgentLightning
强化学习
AI Agent
微软开源
LLM训练
Microsoft Agent-Lightning 深度实战:零代码优化AI代理的训练框架——微软RL训练的革命性工具与生产级实践
编程
Microsoft Agent-Lightning 深度实战:零代码优化AI代理的训练框架——微软RL训练的革命性工具与生产级实践
2026-05-22 21:46:03 +0800 CST
view 36
深度解析微软Agent-Lightning框架,实现零代码修改的AI Agent强化学习训练,解耦架构设计与生产实践
AI Agent
强化学习
微软
RL训练
Agent-Lightning
Agent-Lightning 深度实战:微软开源RL训练框架——零代码优化任意AI代理的生产级实践
编程
Agent-Lightning 深度实战:微软开源RL训练框架——零代码优化任意AI代理的生产级实践
2026-05-22 21:46:28 +0800 CST
view 42
深度解析微软Agent-Lightning框架,实现零代码修改的AI Agent强化学习训练,解耦架构设计与生产实践
AI Agent
强化学习
微软
RL训练
Agent-Lightning
Microsoft Agent Lightning 深度实战:零代码变更优化AI代理的强化学习完全指南(2026)
编程
Microsoft Agent Lightning 深度实战:零代码变更优化AI代理的强化学习完全指南(2026)
2026-05-24 15:00:19 +0800 CST
view 19
深度解析Microsoft Agent Lightning框架,探讨如何通过零代码变更方式优化AI代理,包括架构分析、代码实战和性能优化
AI Agent
强化学习
微软开源
agent训练框架
RL训练
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 469
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
Microsoft Agent Lightning 深度实战:零代码变更优化 AI 代理的强化学习框架——从 Triplet 机制到 VERL 算法的完整指南
编程
Microsoft Agent Lightning 深度实战:零代码变更优化 AI 代理的强化学习框架——从 Triplet 机制到 VERL 算法的完整指南
2026-05-21 21:50:45 +0800 CST
view 48
深度解析微软开源的 Agent Lightning (AGL) 框架,通过"零代码变更"理念,让开发者可以在不修改现有代理逻辑的情况下,使用强化学习、自动提示优化和监督微调等技术优化 AI 代理。
AI Agent
强化学习
Microsoft
Agent Lightning
提示工程
Agent Lightning 深度实战:微软开源的零代码 AI 代理训练框架——Triplet 与 VERL 算法详解
编程
Agent Lightning 深度实战:微软开源的零代码 AI 代理训练框架——Triplet 与 VERL 算法详解
2026-05-21 21:51:08 +0800 CST
view 49
深度解析微软开源的 Agent Lightning (AGL) 框架,通过"零代码变更"理念,让开发者可以在不修改现有代理逻辑的情况下,使用强化学习、自动提示优化和监督微调等技术优化 AI 代理。
AI Agent
强化学习
Microsoft
Agent Lightning
提示工程
AReaL:当异步强化学习遇上大模型Agent,训练效率狂飙2.77倍
编程
AReaL:当异步强化学习遇上大模型Agent,训练效率狂飙2.77倍
2026-04-18 09:13:49 +0800 CST
view 214
深度解析蚂蚁集团开源的大规模异步强化学习框架AReaL,训练效率提升2.77倍,支持数学推理、搜索Agent、多模态等多种场景。
强化学习
Agent
AI训练
开源框架
异步计算
NousResearch Hermes Agent 深度实战:自我进化的 AI Agent 架构设计与 47K Star 现象级开源密码全解析
编程
NousResearch Hermes Agent 深度实战:自我进化的 AI Agent 架构设计与 47K Star 现象级开源密码全解析
2026-05-09 02:36:51 +0800 CST
view 151
深度剖析 NousResearch Hermes Agent 的三层记忆架构、强化学习进化引擎与多模型协同编排,从源码层面理解自我进化的 AI Agent 设计密码。
AI Agent
强化学习
Hermes Agent
NousResearch
Python
Rust
微软 Agent Lightning 深度实战:从零构建可进化的 AI Agent——强化学习训练框架的技术架构与生产级实践
编程
微软 Agent Lightning 深度实战:从零构建可进化的 AI Agent——强化学习训练框架的技术架构与生产级实践
2026-05-22 09:48:50 +0800 CST
view 45
微软开源的Agent Lightning框架深度解析:零代码变更即可对LangChain、AutoGen、CrewAI等主流Agent框架进行强化学习训练,支持PPO、自动Prompt优化和分布式训练
Agent Lightning
强化学习
AI Agent
LangChain
微软
MCP
RL
四舍五入五成双
编程
四舍五入五成双
2024-11-17 05:01:29 +0800 CST
view 3928
四舍六入五成双是一种精确的数字修约规则,适用于有效位数的保留。该方法在处理数字时,依据特定规则决定舍入方式,尤其在统计和化学领域应用广泛。与传统的四舍五入相比,它能更好地减少舍入误差,确保计算结果的准确性。PHP中的round函数提供了多种舍入模式,支持灵活的数字处理。
数学
编程
统计
化学
数据处理
GROMACS:一个美轮美奂的C++库
编程
GROMACS:一个美轮美奂的C++库
2024-11-18 19:43:29 +0800 CST
view 1820
GROMACS是一个开源的C++库,专门用于分子动力学模拟,提供力场计算、能量最小化和自由能计算等功能。它适用于蛋白质、核酸和脂质等生物分子的模拟,并支持多操作系统和硬件平台。本文介绍了GROMACS的应用场景和使用方法,并提供了基本和自定义分子动力学模拟的代码示例,旨在帮助研究者掌握现代C++编程技术。
分子模拟
计算化学
软件开发
FastAI是一个基于PyTorch的深度学习库
综合
FastAI是一个基于PyTorch的深度学习库
2024-11-19 07:02:46 +0800 CST
view 1491
FastAI是一个基于PyTorch的深度学习库,旨在简化深度学习的使用。它提供简单易用的API和高性能的模型训练,支持计算机视觉、自然语言处理等多种应用。通过迁移学习,FastAI能够利用预训练模型提高训练效率。用户可以快速上手,轻松实现图像分类和情感分析等任务,是深度学习爱好者的理想选择。
深度学习
机器学习
人工智能
Python
TimesFM 2.5 深度解析:Google 如何用 200M 参数的时间序列基础模型颠覆传统预测范式
编程
TimesFM 2.5 深度解析:Google 如何用 200M 参数的时间序列基础模型颠覆传统预测范式
2026-04-19 19:46:34 +0800 CST
view 311
Google TimesFM 2.5 时间序列基础模型深度解析:Patched Decoder 架构、XReg 协变量机制、LoRA 微调实战、BigQuery ML 部署,从零样本预测到生产落地全链路指南
TimesFM
时间序列
机器学习
Google
深度学习
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
编程
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
2026-05-12 00:20:07 +0800 CST
view 170
深度解析TabPFN如何用Transformer架构重写表格数据机器学习范式:从合成数据预训练、先验数据拟合原理、2.8秒vs4小时性能对比,到TabPFN-2.5的10万行处理能力与SAP收购战略意义,附完整代码示例
TabPFN,表格数据,Transformer,AutoML,机器学习,XGBoost,PriorLabs,深度学习,基础模型,Python
Easy-AI库,旨在帮助Python开发者轻松入门人工智能开发
综合
Easy-AI库,旨在帮助Python开发者轻松入门人工智能开发
2024-11-17 16:15:26 +0800 CST
view 1775
本文介绍了Easy-AI库,旨在帮助Python开发者轻松入门人工智能开发。内容涵盖了Easy-AI的安装、基本用法、高级特性及实际案例,展示了如何使用该库进行数据预处理、模型定义、训练和评估。Easy-AI的简洁API使得即使是初学者也能快速构建功能完善的AI系统。
人工智能
Python编程
机器学习
深度学习
开发工具
Karpathy AutoResearch 深度解析:630行代码如何让AI学会「自己做研究」
编程
Karpathy AutoResearch 深度解析:630行代码如何让AI学会「自己做研究」
2026-04-23 10:51:04 +0800 CST
view 341
深入解析Andrej Karpathy的开源项目AutoResearch,630行Python代码如何实现AI自主研究,探讨约束驱动的设计哲学与工程实践
Python
机器学习
AI Agent
深度学习
自动优化
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
编程
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
2026-05-14 01:14:23 +0800 CST
view 151
ReAct框架是AI Agent的核心架构范式,通过Thought-Action-Observation循环实现智能推理与行动。本文深度解析其从字符串解析到原生Tool Calling的演进历程、LangGraph状态机架构、代码实战及最佳实践。
ReAct,AI Agent,TAO循环,Function Calling,LangGraph,大语言模型,深度学习,Python,机器学习,智能体
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
综合
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
2024-11-18 19:34:19 +0800 CST
view 1817
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程。它提供多种工具,如集成梯度、SaliencyMap和DeepLift,帮助开发者理解模型对输入数据的依赖关系和特征重要性。Captum提升了模型的透明度和可解释性,适用于模型审查、优化和调试等场景。
深度学习
模型解释
机器学习
AGIBOT WORLD 2026:智元开源全球首个具身智能全域数据集,机器人「大脑」终于有了真实世界教材
编程
AGIBOT WORLD 2026:智元开源全球首个具身智能全域数据集,机器人「大脑」终于有了真实世界教材
2026-04-08 14:12:17 +0800 CST
view 374
具身智能
AGIBOT
机器人学习
模仿学习
数据集开源
Embodied AI
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
5
下一页