程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
AI Scientist-v2 深度解析:当 AI 第一次独立完成顶会论文并通过同行评审
编程
AI Scientist-v2 深度解析:当 AI 第一次独立完成顶会论文并通过同行评审
2026-04-11 11:46:16 +0800 CST
view 789
AI Scientist-v2 是 Sakana AI 发布的自动化科研论文生成系统,能端到端完成从想法到顶会论文的全流程。本文从程序员视角深入剖析其技术架构、Agentic Tree Search 机制与代码实现,并探讨其对科研和开发者的真实影响。
AI Agent
科研自动化
LLM
机器学习
Nature
MoneyPrinterTurbo 深度实战:用 AI 大模型一键生成高清短视频——从 LLM 调度策略到批量视频生产的工程化完全指南(2026)
编程
MoneyPrinterTurbo 深度实战:用 AI 大模型一键生成高清短视频——从 LLM 调度策略到批量视频生产的工程化完全指南(2026)
2026-06-02 19:44:20 +0800 CST
view 529
MoneyPrinterTurbo 深度实战,详解用 AI 大模型一键生成高清短视频的完整工程化方案,涵盖 LLM 调度、素材检索、TTS 配音、FFmpeg 合成与批量生产优化。
AI视频生成
LLM应用
Python实战
短视频自动化
FFmpeg
oMLX 深度实战:当 macOS 菜单栏成为本地 LLM 推理的控制中心——从连续批处理到 SSD 分层缓存、从 MLX 后端加速到生产级部署的完全指南(2026)
编程
oMLX 深度实战:当 macOS 菜单栏成为本地 LLM 推理的控制中心——从连续批处理到 SSD 分层缓存、从 MLX 后端加速到生产级部署的完全指南(2026)
2026-06-22 17:24:05 +0800 CST
view 213
oMLX 是专为 Apple Silicon 优化的 LLM 推理服务器,通过连续批处理、分层 KV Cache、MLX 后端加速和 macOS 菜单栏管理,让本地 AI 推理从可用走向实用。
LLM
Apple Silicon
MLX
本地推理
MCP
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
编程
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
2026-05-17 01:50:10 +0800 CST
view 290
Agent-fox是一个基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图,支持自然语言测试、自动元素定位、自愈机制等核心功能。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM
Stanford CS336 深度实战:从零实现大语言模型——数据清洗、Transformer 架构、FlashAttention 系统优化到 RL 对齐的完全指南(2026)
编程
Stanford CS336 深度实战:从零实现大语言模型——数据清洗、Transformer 架构、FlashAttention 系统优化到 RL 对齐的完全指南(2026)
2026-06-02 20:14:38 +0800 CST
view 248
Stanford CS336 课程深度解读:从零实现大语言模型,覆盖 Tokenizer、Transformer、FlashAttention-2、FSDP 分布式训练、Scaling Law、Common Crawl 数据清洗去重、SFT 与 GRPO 对齐,配完整代码示例。
LLM
Transformer
Stanford CS336
FlashAttention
PyTorch
AI工程
分布式训练
强化学习
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
编程
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
2026-05-17 01:50:54 +0800 CST
view 354
Agent-fox是基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图。核心特性包括:自然语言解析引擎(NL Parser)、多策略融合元素定位(Smart Locator)、数据准备智能体(Data Preparation Agent)和自愈恢复机制。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM,测试框架
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
编程
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
2026-06-02 21:19:20 +0800 CST
view 1214
Headroom 是专为 LLM 设计的通用压缩层,以 Library、Proxy、MCP Server 三种形态存在,在信息不丢失的前提下把 Token 消耗砍掉 60-95%。本文从信息论底层原理讲起,完整拆解四层压缩管线,结合真实代码实战演示接入方式。
LLM
Token优化
GitHub Trending
Python
RAG
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
编程
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
2026-06-02 21:45:53 +0800 CST
view 396
Hermes WebUI 今日飙升 1725 星。本文深度拆解其架构设计、SSE流式传输机制、多模型路由策略、工具调用可视化实现,以及从本地部署到生产级优化的完整指南。
Hermes
WebUI
SSE
LLM
Agent
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
编程
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
2026-05-11 09:23:06 +0800 CST
view 411
Goose 是由 Block 开源、现已捐献给 Linux 基金会 AAIF 的本地 AI 编程代理。最新版本 v1.32.0(2026年5月6日)支持 Exa AI 搜索、桌面通知、@agent 协作、/skills 命令、自动压缩上下文、语音听写等功能。Rust 开发,支持 MCP 协议,可连接任何 LLM(OpenAI、Ollama、Kimi Code 等),完全本地运行无需订阅。
Goose
AI编程
本地LLM
MCP
Rust
Linux基金会
Block
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
编程
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
2026-06-02 22:14:57 +0800 CST
view 299
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 383
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
编程
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
2026-06-02 22:15:17 +0800 CST
view 386
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
编程
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
2026-05-23 20:00:37 +0800 CST
view 268
深度剖析 Unsloth 如何通过手写 Triton 内核、智能显存管理和 LoRA/QLoRA 优化,实现训练速度 2-5 倍提升、显存占用降低 70% 的技术奇迹。
LLM
微调
Unsloth
LoRA
深度学习
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
编程
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
2026-06-02 23:44:03 +0800 CST
view 356
Microsoft 开源的 MarkItDown 在 2026 年引爆 AI 工程圈。本文从源码级架构解析、多格式解析引擎、与 LLM 工具链的集成实战、性能优化到生产级 RAG 管道,全面拆解这款改变 AI 工程范式的工具。
Microsoft
MarkItDown
Markdown
LLM
RAG
Python
文档解析
AI工程
OctaFuse Gateway:统一管理Coding Plan/Token Plan的开源AI网关,个人SaaS都能用
编程
OctaFuse Gateway:统一管理Coding Plan/Token Plan的开源AI网关,个人SaaS都能用
2026-06-22 21:00:01 +0800 CST
view 117
OctaFuse Gateway开源AI网关,把Provider、模型路由、API Key、用户、预算、用量审计、财务记账和管理后台放在一起。个人用可统一Coding Plan/Token Plan入口;做SaaS可变成LLM服务底座。支持OpenAI/Anthropic/Gemini多协议,Provider Key池统一调度多套额度,三层成本口径(metered/standard/charged),自带Admin后台+Playground+Simulator。
OctaFuse
AI网关
开源
LLM管理
多模型路由
SaaS
计费审计
Provider Key池
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 364
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
编程
MarkItDown 深度实战:当微软用Python重写文档预处理——从转换器链到LLM集成的生产级完全指南(2026)
2026-06-12 13:48:19 +0800 CST
view 222
深度剖析微软开源的MarkItDown工具,详解其转换器链架构、插件系统、LLM集成和大规模文档处理性能优化,提供15个完整代码示例和生产级部署方案。
MarkItDown
文档预处理
LLM
RAG
Python
微软
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
编程
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
2026-06-12 14:20:52 +0800 CST
view 186
深度解析 ICML 2026 接收的 CLEAR 推理优化方法。浙江大学、腾讯、北京大学联合提出:对没有希望的问题理性放弃,把算力集中到能解决的问题上。包含完整 Python 实现、vLLM/SGLang 集成、生产级部署指南。
LLM
推理优化
ICML 2026
CLEAR
算力分配
MarkItDown 深度解析:微软10万星开源工具如何重塑 LLM 时代的文档处理范式
编程
MarkItDown 深度解析:微软10万星开源工具如何重塑 LLM 时代的文档处理范式
2026-04-21 05:47:35 +0800 CST
view 507
深度解析微软开源工具MarkItDown:如何将PDF、Word、Excel等20+格式转换为结构化Markdown,为LLM和RAG场景提供高质量的文档预处理方案。涵盖架构设计、实战代码、性能优化与生产部署最佳实践。
MarkItDown
文档转换
LLM
RAG
Python
开源工具
微软
Headroom 深度实战:当 AI Agent 的 Token 账单被压缩 90%——从六大压缩算法到 CCR 可逆存储、跨 Agent 记忆与 KV Cache 命中率优化的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 的 Token 账单被压缩 90%——从六大压缩算法到 CCR 可逆存储、跨 Agent 记忆与 KV Cache 命中率优化的生产级完全指南(2026)
2026-06-17 15:22:23 +0800 CST
view 241
Headroom 是开源上下文压缩中间层,六大算法覆盖 JSON/代码/文本/图片,CCR 可逆存储,跨 Agent 记忆,实测节省 60-95% Token,精度保留 97%。
Headroom
AI Agent
Token优化
LLM
上下文压缩
Vera 编程语言深度解析:当一门语言从设计之初就为 LLM 而生
编程
Vera 编程语言深度解析:当一门语言从设计之初就为 LLM 而生
2026-06-17 16:27:35 +0800 CST
view 169
深度解析 Vera 编程语言——一门从设计之初就专为 LLM 编写的编程语言,涵盖强制合约验证、结构引用、效果类型系统、WebAssembly 编译等核心技术。
编程语言
AI编程
LLM
形式化验证
WebAssembly
Z3
TradingAgents 深度实战:从 78.7k Star 的多智能体交易框架到量化投研工程化完全指南
编程
TradingAgents 深度实战:从 78.7k Star 的多智能体交易框架到量化投研工程化完全指南
2026-05-24 06:38:48 +0800 CST
view 668
深度拆解 TradingAgents 多智能体交易框架的架构设计,从 LangGraph 状态图编排到结构化辩论机制,完整代码实战指南
AI Agent
量化交易
LangGraph
多智能体
LLM
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
编程
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
2026-04-12 15:55:06 +0800 CST
view 733
AI Scientist-v2 由 Sakana AI 联合牛津大学等机构研发,于 2026 年正式发表于 Nature,首次实现端到端科研自动化。其核心创新 Agentic Tree Search 让 AI 在 ML 领域生成论文通过 ICLR Workshop 双盲评审,获 6.33 分高于 55% 人类投稿。本文全面解析其系统架构、核心算法与未来方向。
AI Scientist
Sakana AI
Agentic Tree Search
科研自动化
AI Agent
LLM
Nature
Understand Anything 深度实战:当知识图谱颠覆代码理解——从多智能体管道到可交互代码地图的完整指南(2026)
编程
Understand Anything 深度实战:当知识图谱颠覆代码理解——从多智能体管道到可交互代码地图的完整指南(2026)
2026-06-17 21:26:38 +0800 CST
view 241
Understand Anything 将任意代码库转化为交互式知识图谱,用多智能体管道解决代码理解难题。本文深度解析其架构设计与实战应用。
AI
LLM
代码分析
知识图谱
GitHub
Claude
多智能体
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
13
14
15
16
17
...
34
下一页