程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
AI Hedge Fund 深度解析:当巴菲特遇上大模型——多智能体投资系统的工程革命
编程
AI Hedge Fund 深度解析:当巴菲特遇上大模型——多智能体投资系统的工程革命
2026-04-14 04:53:29 +0800 CST
view 1624
深度解析 GitHub 51.7k Star 项目 AI Hedge Fund:如何用 15+ AI Agent 复刻巴菲特、芒格等传奇投资人的思维范式,探索多智能体协作在投资决策中的工程实践。
AI Hedge Fund
多智能体系统
投资Agent
巴菲特
GitHub Trending
Python
LLM应用
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
编程
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
2026-04-16 16:42:03 +0800 CST
view 509
RedditVideoMakerBot 是一个将 Reddit 帖子链接自动制作成视频的开源工具,支持语音合成、自动配图、字幕生成和背景音乐。
Reddit
视频自动化
Python
MoviePy
PRAW
内容创作
开源工具
本地优先的 AI 记忆系统 MemPalace 深度解析:96.6% R@5 背后的架构设计
编程
本地优先的 AI 记忆系统 MemPalace 深度解析:96.6% R@5 背后的架构设计
2026-04-28 12:24:56 +0800 CST
view 521
深度解析 MemPalace 源码:从宫殿记忆隐喻、存储后端抽象、ONNX embedding 加速、LLM closet 生成到 entity 检测,完整剖析 96.6% R@5 背后的工程设计。
AI
记忆系统
向量数据库
ONNX
Embedding
Python
ChromaDB
开源
HuggingFace ml-intern 深度解析:一个能读论文、训模型、推上线的 AI 工程师,从架构到源码的完整拆解
编程
HuggingFace ml-intern 深度解析:一个能读论文、训模型、推上线的 AI 工程师,从架构到源码的完整拆解
2026-05-01 03:24:14 +0800 CST
view 338
HuggingFace ml-intern 深度拆解:从 Agent Loop 架构到 Doom Loop 检测器,从 Research Sub-agent 到 ToolRouter,完整解析这个能自主完成论文研究、模型训练、云端部署的 AI 工程师
AI Agent
HuggingFace
ML
深度学习
Python
开源
HuggingFace ml-intern 深度解析:从架构到源码,拆解这个能读论文训模型推上线的AI工程师
编程
HuggingFace ml-intern 深度解析:从架构到源码,拆解这个能读论文训模型推上线的AI工程师
2026-05-01 03:24:43 +0800 CST
view 688
HuggingFace ml-intern 深度拆解:从 Agent Loop 架构到 Doom Loop 检测器,从 Research Sub-agent 到 ToolRouter,完整解析这个能自主完成论文研究、模型训练、云端部署的 AI 工程师
AI Agent
HuggingFace
ML
深度学习
Python
开源
一条命令读论文训模型:HuggingFace ml-intern 开源 ML 工程师深度实战
编程
一条命令读论文训模型:HuggingFace ml-intern 开源 ML 工程师深度实战
2026-05-23 14:14:52 +0800 CST
view 322
深入解析HuggingFace推出的ml-intern开源ML工程师Agent,从架构设计到生产部署,一句话搞定从读论文到发布模型的全流程。
AI
ML
HuggingFace
Agent
机器学习
LoRA
Python
MemPalace 深度实战:当记忆宫殿遇上 AI Agent——从 2000 年前认知术到 96.6% 召回率的本地记忆系统完全指南(2026)
编程
MemPalace 深度实战:当记忆宫殿遇上 AI Agent——从 2000 年前认知术到 96.6% 召回率的本地记忆系统完全指南(2026)
2026-06-12 15:20:19 +0800 CST
view 273
从 2000 年前古希腊记忆术到 96.6% R@5 的 AI 本地记忆系统,深度解析 MemPalace 的 Wing/Room/Drawer 架构、可插拔后端设计与 MCP 集成实践
AI记忆
MemPalace
MCP
向量检索
RAG
本地部署
Python
AI Agent
merge2excel是一个强大的Python库,能够快速合并多个Excel文件,提升数据处理效率
综合
merge2excel是一个强大的Python库,能够快速合并多个Excel文件,提升数据处理效率
2024-11-19 02:17:28 +0800 CST
view 1580
merge2excel是一个强大的Python库,能够快速合并多个Excel文件,提升数据处理效率。本文介绍了其安装、基本用法和高级功能,包括合并指定工作表和添加新工作表的示例。通过实际案例,展示了如何合并不同地区的数据和过滤特定工作表,帮助用户灵活应用该库于项目中。
Python库
数据处理
Excel工具
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 694
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
xlwings是一个用于与Excel进行交互的Python库
综合
xlwings是一个用于与Excel进行交互的Python库
2024-11-19 07:16:23 +0800 CST
view 2244
xlwings是一个用于与Excel进行交互的Python库,提供简单易用的API,支持Excel的所有功能,包括公式、图表和透视表。本文介绍了xlwings的安装方法、主要特性、基本和高级功能,以及在财务数据处理、数据可视化和报表生成等实际应用场景中的使用,帮助开发者高效地操作Excel文件。
Python库
数据分析
Excel自动化
数据可视化
财务分析
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
2026-06-10 10:17:56 +0800 CST
view 177
深度解析 vLLM 的核心架构 PagedAttention 和 Continuous Batching,从内存管理原理到生产级分布式部署的完全指南。
vLLM
LLM推理
PagedAttention
GPU优化
大模型部署
AI推理
vLLM 2026 推理引擎全解:从 PagedAttention 到分离式 Prefill,如何把大模型跑出 GPU 极限性能
编程
vLLM 2026 推理引擎全解:从 PagedAttention 到分离式 Prefill,如何把大模型跑出 GPU 极限性能
2026-06-29 17:16:04 +0800 CST
view 27
2026年vLLM 0.18深度解析:PagedAttention显存管理、EAGLE3推测解码、连续批处理、分离式Prefill、FP4量化,附生产级部署代码与Benchmark对比
vLLM
LLM推理
PagedAttention
推测解码
EAGLE3
FP4量化
CUDA
GPU性能优化
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
编程
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
2026-06-29 17:17:00 +0800 CST
view 18
2026年vLLM 0.18深度解析:PagedAttention显存管理、EAGLE3推测解码、连续批处理、分离式Prefill、FP4量化,附生产级部署代码与Benchmark对比
vLLM
LLM推理
PagedAttention
推测解码
EAGLE3
FP4量化
CUDA
GPU性能优化
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
编程
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
2026-04-10 03:35:31 +0800 CST
view 643
claude-memory-compiler 把 AI 对话当作源代码,用 LLM 编译成结构化知识库,让 Claude Code 拥有跨会话记忆能力
Claude Code
AI Agent
Knowledge Management
LLM
Memory System
百度 Unlimited OCR 深度解析:R-SWA 如何把 KV Cache 从线性增长压成常数,端到端 OCR 的长文档革命
编程
百度 Unlimited OCR 深度解析:R-SWA 如何把 KV Cache 从线性增长压成常数,端到端 OCR 的长文档革命
2026-06-29 19:45:14 +0800 CST
view 15
深度解析百度开源的 Unlimited OCR:R-SWA 如何把 KV Cache 从线性增长压成常数,解决长文档 OCR 的失忆问题,OmniDocBench v1.6 刷新 SOTA 93.92%
Unlimited OCR
百度
OCR
端到端
长文档
R-SWA
开源
深度学习
文档解析
Markdown
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
2026-06-11 03:16:24 +0800 CST
view 212
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
编程
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
2026-06-11 03:17:21 +0800 CST
view 333
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
2026 大模型推理框架终极对决:vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9——从架构原理到生产级部署的完全指南
编程
2026 大模型推理框架终极对决:vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9——从架构原理到生产级部署的完全指南
2026-06-16 23:24:43 +0800 CST
view 156
深度对比四大主流LLM推理框架:vLLM 0.5、TGI 2.0、TensorRT-LLM 1.8、DeepSpeed-MII 0.9。从PagedAttention架构原理、FlashAttention优化、量化支持到生产级部署实战,包含统一环境下的性能测试数据与代码示例,帮助你做出最优选型决策。
LLM
推理框架
vLLM
TensorRT
DeepSpeed
性能优化
AI
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 381
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
GreptimeDB 深度实战:当可观测性告别「三件套」——从宽事件统一引擎到存算分离、Flow 流处理与 PB 级日检索亚秒的生产级完全指南(2026)
编程
GreptimeDB 深度实战:当可观测性告别「三件套」——从宽事件统一引擎到存算分离、Flow 流处理与 PB 级日检索亚秒的生产级完全指南(2026)
2026-06-17 10:58:30 +0800 CST
view 148
GreptimeDB深度实战:从宽事件统一模型到存算分离架构、Flow流处理引擎、SQL+PromQL双查询、PB级亚秒检索的完整生产级指南
GreptimeDB
可观测性
时序数据库
Rust
OpenTelemetry
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 392
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 373
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
2026大模型推理框架终极对决:vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9——谁才是生产级部署的真正王者?
编程
2026大模型推理框架终极对决:vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9——谁才是生产级部署的真正王者?
2026-06-23 08:22:26 +0800 CST
view 128
深度对比2026年四大主流大模型推理框架:vLLM 0.5、TGI 2.0、TensorRT-LLM 1.8、DeepSpeed-MII 0.9,从核心架构、性能压测、成本分析到代码实战的完全指南。
vLLM
TensorRT-LLM
大模型推理
性能优化
DeepSpeed
TGI
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 515
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
5
6
7
8
9
...
45
下一页