程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
编程
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
2026-05-09 18:51:15 +0800 CST
view 6
腾讯混元开源 HunyuanVideo 1.5 视频生成模型,8.3B 参数 Diffusion Transformer 架构,14G 显存消费级显卡可运行。SSTA 稀疏注意力机制实现推理速度 1.87 倍提升,3D 因果 VAE 实现空间 16 倍、时间 4 倍压缩。
AI视频生成
腾讯混元
HunyuanVideo
Diffusion Transformer
SSTA
开源模型
消费级显卡
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 201
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 195
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
编程
GuppyLM:5分钟从零训练一个LLM,870万参数小鱼模型的完整教学
2026-05-01 04:35:06 +0800 CST
view 90
GuppyLM是开源教育项目,870万参数小鱼角色扮演模型,5分钟Colab训练,覆盖数据生成到ONNX部署全流程,适合LLM初学者。
LLM
深度学习
开源
教学
Transformer
Transformers.js v4 深度解析:WebGPU 原生化让 AI 推理在 Node/Bun/Deno 中真正起飞
编程
Transformers.js v4 深度解析:WebGPU 原生化让 AI 推理在 Node/Bun/Deno 中真正起飞
2026-04-12 04:55:32 +0800 CST
view 374
深度解析 Transformers.js v4 的 WebGPU 原生化架构:如何用 C++ 重写 WebGPU Runtime、与 ONNX Runtime 深度集成、在 Node/Bun/Deno 中实现原生 GPU AI 推理。包含代码实战、性能对比与生产部署指南。
JavaScript
AI
WebGPU
Transformers
HuggingFace
Node.js
Bun
Deno
ONNX
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 231
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
编程
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
2026-04-17 10:15:58 +0800 CST
view 219
2026年4月,MIT、英伟达、浙江大学联合发布TriAttention,用三角函数建模注意力距离偏好,实现KV缓存10.7倍压缩,让单卡4090跑出百万Token上下文。
AI
大模型
Transformer
注意力机制
KV缓存
长上下文
模型优化
论文解读
2026
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
编程
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
2026-04-08 16:35:10 +0800 CST
view 385
Google TimesFM 2.5 时间序列预测基础模型深度解析:200M参数零样本预测,16k上下文,Decoder-only Transformer架构,Patch分词,Monash基准测试击败监督模型
时间序列
机器学习
Google
Transformer
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
编程
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
2026-04-18 12:45:10 +0800 CST
view 264
深度解析MIT/NVIDIA/浙大联合发布的TriAttention技术,用三角函数预测注意力分布,实现KV Cache智能压缩,让超长上下文推理成为可能
大模型
注意力机制
KV缓存
Transformer
深度学习
AI优化
VibeVoice 深度解析:微软如何用 7.5Hz 连续语音分词器重新定义语音 AI 的边界
编程
VibeVoice 深度解析:微软如何用 7.5Hz 连续语音分词器重新定义语音 AI 的边界
2026-04-18 07:48:59 +0800 CST
view 148
微软开源的 VibeVoice 用 7.5Hz 连续语音分词器和 Next-token Diffusion 框架,实现了 60 分钟长音频单次处理,正在重新定义语音 AI 的技术边界。本文深度解析其架构设计、工程实践和部署优化。
VibeVoice
语音AI
ASR
TTS
微软开源
Next-token Diffusion
连续语音分词器
ICLR 2026
Whisper替代
长音频处理
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
编程
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
2026-04-15 22:19:22 +0800 CST
view 190
深度解析微软VibeVoice开源语音AI全家桶:7.5Hz连续Tokenizer如何压缩60分钟音频,Next-Token Diffusion如何驱动90分钟对话合成,附完整代码实战与性能对比。
VibeVoice
微软
语音AI
ASR
TTS
Diffusion
LLM
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
编程
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
2026-04-10 02:23:58 +0800 CST
view 413
深入解析OpenScreen:26K Stars的GitHub开源录屏工具,用Electron+FFmpeg技术栈复现Screen Studio全部核心功能,包括自动缩放、运动模糊、背景虚化等。跨平台支持macOS/Windows/Linux,完全免费开源。
OpenScreen
Screen Studio
Electron
FFmpeg
开源录屏
桌面应用
TypeScript
NeverWrite 深度实战:用 Electron+Rust 打造 AI 可审阅的多窗格 Markdown 工作区——从混合架构到 Diff 引擎的全链路解析
编程
NeverWrite 深度实战:用 Electron+Rust 打造 AI 可审阅的多窗格 Markdown 工作区——从混合架构到 Diff 引擎的全链路解析
2026-05-07 02:09:42 +0800 CST
view 74
NeverWrite开源项目深度实战解析:Electron+Rust混合架构、WASM Diff引擎实现AI可审阅编辑、多窗格工作区、全格式支持、反向链接知识图谱的全链路技术剖析
NeverWrite
Electron
Rust
WASM
Markdown
AI审阅
开源工具
Diff引擎
AI Hedge Fund 深度解析:当巴菲特遇上大模型——多智能体投资系统的工程革命
编程
AI Hedge Fund 深度解析:当巴菲特遇上大模型——多智能体投资系统的工程革命
2026-04-14 04:53:29 +0800 CST
view 758
深度解析 GitHub 51.7k Star 项目 AI Hedge Fund:如何用 15+ AI Agent 复刻巴菲特、芒格等传奇投资人的思维范式,探索多智能体协作在投资决策中的工程实践。
AI Hedge Fund
多智能体系统
投资Agent
巴菲特
GitHub Trending
Python
LLM应用
Wasmtime 43.0.0 深度解析:Fuel 机制从「粗粒度熔断」到「Opcode 级成本精算」的工程革命
编程
Wasmtime 43.0.0 深度解析:Fuel 机制从「粗粒度熔断」到「Opcode 级成本精算」的工程革命
2026-04-13 16:26:40 +0800 CST
view 200
深入解析 Wasmtime 43.0.0 引入的细粒度 Fuel Opcode 成本配置机制,从底层原理到生产实战配完整代码示例
WebAssembly
Wasmtime
Fuel机制
Cranelift
WASI
只需浏览器!FastAPI+Vue3打造开源高性能Web SSH终端LingTerm
编程
只需浏览器!FastAPI+Vue3打造开源高性能Web SSH终端LingTerm
2026-04-21 10:51:33 +0800 CST
view 185
LingTerm:FastAPI+Vue3打造的高性能Web SSH终端,无需安装,打开浏览器就能连接服务器,支持SFTP、可视化文件管理、多标签、主题定制
开源
SSH
Web终端
FastAPI
Vue3
xterm.js
SFTP
Python
运维工具
WebSocket
Go 1.23 迭代器革命:range-over-func 如何重塑 Go 语言的函数式编程范式
编程
Go 1.23 迭代器革命:range-over-func 如何重塑 Go 语言的函数式编程范式
2026-04-12 10:56:33 +0800 CST
view 202
深入解析Go 1.23引入的range-over-func与iter包,从底层原理到工程实践,系统讲解Go语言历史上最重要的语言特性升级之一。包含完整代码示例与性能分析。
Go语言
Golang
迭代器
range-over-func
函数式编程
Go1.23
Rust 异步编程深度剖析:从 Future 状态机到 Tokio 调度器的全链路实战
编程
Rust 异步编程深度剖析:从 Future 状态机到 Tokio 调度器的全链路实战
2026-04-29 05:10:14 +0800 CST
view 123
从 Future trait 底层机制到 Tokio 调度器工作窃取算法,深度剖析 Rust 异步编程全链路,含手写执行器、Pin/Waker 原理、生产级 TCP 代理实战
Rust
异步编程
Tokio
Future
async
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 621
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
超越 OpenClaw 的 Agent 新王:Hermes Agent 自进化闭环架构深度解析
编程
超越 OpenClaw 的 Agent 新王:Hermes Agent 自进化闭环架构深度解析
2026-04-17 19:45:47 +0800 CST
view 163
深度解析 Nous Research 开源的 Hermes Agent,从四层记忆系统、自进化闭环、平台无关核心架构等角度全面剖析这个 2026 年最火的开源 AI Agent 项目,并对比 OpenClaw 的技术路线差异
AI Agent
Hermes Agent
Nous Research
自我进化
四层记忆
开源项目
GitHub Trending
Rust 改造 CPython 全链路实战:从 FFI 边界设计到 PyO3 内部机制,拆解 Python 3.16 底层重构的每一个技术细节
编程
Rust 改造 CPython 全链路实战:从 FFI 边界设计到 PyO3 内部机制,拆解 Python 3.16 底层重构的每一个技术细节
2026-05-01 02:25:15 +0800 CST
view 100
深度拆解 Rust for CPython 项目的 FFI 边界设计、构建系统集成、PyO3 内部机制和模块迁移实战
Rust
Python
CPython
PyO3
FFI
内存安全
Google TimesFM 深度解析:14K Star 的时间序列基础模型如何用 200M 参数颠覆零样本预测
编程
Google TimesFM 深度解析:14K Star 的时间序列基础模型如何用 200M 参数颠覆零样本预测
2026-04-28 18:22:55 +0800 CST
view 146
深度解析 Google TimesFM:200M 参数如何在 1000 亿时间点上预训练后实现零样本超越有监督模型,覆盖架构原理、代码实战、性能对比与生产部署完整指南。
AI大模型
时间序列预测
Google
TimesFM
零样本预测
深度学习
GitHub开源
预训练模型
TimesFM 2.5 深度解析:Google 如何用 200M 参数的时间序列基础模型颠覆传统预测范式
编程
TimesFM 2.5 深度解析:Google 如何用 200M 参数的时间序列基础模型颠覆传统预测范式
2026-04-19 19:46:34 +0800 CST
view 232
Google TimesFM 2.5 时间序列基础模型深度解析:Patched Decoder 架构、XReg 协变量机制、LoRA 微调实战、BigQuery ML 部署,从零样本预测到生产落地全链路指南
TimesFM
时间序列
机器学习
Google
深度学习
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
编程
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
2026-04-21 08:46:51 +0800 CST
view 168
FFmpegFree:Vue3+TypeScript+Go+Wails跨平台桌面工具,支持音视频互转、RTMP/HLS推流、屏幕录制推流、FLV拉流播放、Office转PDF
开源
桌面应用
FFmpeg
音视频
Go
Vue3
Wails
流媒体
RTMP
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
20
下一页