程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
DeepSeek V4 Flash 深度解析:开源大模型的 Agent 时代新范式
编程
DeepSeek V4 Flash 深度解析:开源大模型的 Agent 时代新范式
2026-06-30 09:16:27 +0800 CST
view 18
深度解析 DeepSeek V4 Flash 的 Ultra-MoE、CSA+HCA 混合注意力、mHC 流形约束、Engram 条件记忆四大架构创新,以及 DSpark 投机解码带来的 60-85% 推理加速。涵盖 SWE-bench 79% 性能分析、API 调用实战与部署方案。
DeepSeek
V4 Flash
MoE
开源大模型
AI Agent
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
2026-06-17 07:55:50 +0800 CST
view 163
Google开源DiffusionGemma:基于离散文本扩散的26B MoE模型,并行去噪实现4倍推理加速,双向注意力天然支持代码补全与行内编辑
DiffusionGemma
LLM
扩散模型
推理加速
MoE
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
编程
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
2026-06-22 20:57:32 +0800 CST
view 474
百度开源Unlimited OCR:3B参数500M激活,在OmniDocBench v1.6拿下93.92%端到端SOTA超越Qwen3-VL和Gemini。核心技术R-SWA参考滑动窗口注意力+DeepEncoder 16倍视觉压缩,实现40+页长程解析不失忆。疑似DeepSeek OCR核心作者魏浩然出走百度之作。
百度
OCR
开源
R-SWA
DeepEncoder
MoE
长程解析
SOTA
百度 Unlimited-OCR 深度解析:R-SWA 注意力机制如何用 3B 参数打爆百亿模型
编程
百度 Unlimited-OCR 深度解析:R-SWA 注意力机制如何用 3B 参数打爆百亿模型
2026-06-30 16:16:03 +0800 CST
view 20
2026年6月百度开源Unlimited-OCR深度解析:R-SWA参考滑动窗口注意力机制将KV Cache从线性增长压成常数,3B MoE模型用500M激活参数在OmniDocBench上以93.92%总分刷新SOTA,打爆Qwen3-VL 72B和Gemini 2.5 Pro。万字长文从架构原理到代码实战全覆盖。
Unlimited-OCR
端到端OCR
R-SWA
百度
注意力机制
大模型
MoE
深度学习
AI开源
文档解析
万字深度解析百度 Unlimited OCR:当 R-SWA 遇见 MoE——3B 参数如何碾压端到端 OCR 全场(2026)
编程
万字深度解析百度 Unlimited OCR:当 R-SWA 遇见 MoE——3B 参数如何碾压端到端 OCR 全场(2026)
2026-07-01 03:42:17 +0800 CST
view 20
2026年6月百度开源Unlimited OCR,5天GitHub Star破万。深度解析R-SWA注意力机制、MoE架构、16倍视觉Token压缩,以及为何能将KV Cache从线性增长压成常数。
Unlimited OCR
OCR
R-SWA
MoE
百度
深度学习
计算机视觉
文档识别
KV Cache
DiffusionGemma 深度实战:当谷歌用图像扩散的逻辑重塑文本生成——从离散扩散原理到 4 倍推理加速的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当谷歌用图像扩散的逻辑重塑文本生成——从离散扩散原理到 4 倍推理加速的生产级完全指南(2026)
2026-06-17 23:28:33 +0800 CST
view 206
2026年6月谷歌开源DiffusionGemma,26B MoE参数仅激活3.8B,通过离散扩散实现4倍推理加速。本文从原理、架构、代码实战、性能优化全面深度解析这一范式级创新。
DiffusionGemma
谷歌
文本扩散
MoE
AI推理
Gemma
开源模型
离散扩散
并行生成
深度学习
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 412
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
编程
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
2026-06-13 20:17:57 +0800 CST
view 265
Redis之父antirez新作DwarfStar 4深度解析:专为DeepSeek V4 Flash打造的本地推理引擎,非对称2-bit量化、磁盘KV缓存、Metal图执行、分布式推理、方向引导,MacBook上284B模型跑出26 tok/s的完全指南
ds4
DwarfStar
DeepSeek
本地推理
Metal
MoE
量化
KV缓存
微软Build 2026震撼发布:7款MAI自研模型全解析——从"OpenAI金主"到"模型自研商"的战略革命
编程
微软Build 2026震撼发布:7款MAI自研模型全解析——从"OpenAI金主"到"模型自研商"的战略革命
2026-06-26 19:44:06 +0800 CST
view 103
深度解析微软在Build 2026发布的7款MAI自研模型:从MAI-Thinking-1的MoE架构创新到MAI-Orion的性能怪兽,从"不蒸馏"训练哲学到成本直降10倍的商业逻辑,万字长文带你读懂微软AI战略的惊险跳跃。
MAI
微软
Build2026
MoE
自研模型
AI战略
Azure
推理模型
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
资讯
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
2026-04-23 21:18:45 +0800 CST
view 649
2026年4月23日,腾讯发布并开源新一代大模型混元Hy3preview,总参数295B、激活参数21B的MoE架构,支持256K超长上下文,推理效率提升40%,API最低1.2元/百万tokens。在复杂推理、代码与Agent能力上表现突出,接近GPT-5.4级别,数学推理创国内最高纪录。已接入腾讯云、元宝等多条产品线,并上架TokenHub。
人工智能
大模型
腾讯
开源
MoE
推理
代码生成
Agent
云计算
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
编程
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
2026-06-27 02:13:37 +0800 CST
view 126
深度解析百度2026年6月开源的Unlimited OCR模型,介绍其R-SWA机制如何解决长文档OCR的KV cache线性增长问题,包含完整实战代码和性能优化技巧。
Unlimited OCR
百度
OCR
深度学习
MoE
R-SWA
长文档解析
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
编程
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
2026-05-14 03:40:08 +0800 CST
view 338
2026年奇点智能技术大会正式提出AI原生前端开发范式,LLM不再只是辅助工具而是编译过程的一部分。深度解析LLM-as-Compiler、编译时语义理解、声明式UI合成及Vite5.4+插件调用本地MoE模型的技术实现。
AI原生前端,LLM-as-Compiler,编译时语义理解,声明式UI合成,Vite5.4,MoE模型
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
编程
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
2026-05-28 16:37:41 +0800 CST
view 214
深入解析 Meta Llama 4 的 MoE 混合专家架构原理,探讨其如何以 17B 激活参数撬动万亿级算力,并提供完整的本地部署实战指南。
Llama4
MoE
混合专家
开源大模型
本地部署
Meta
人工智能
深度学习
DwarfStar 4 深度实战:当 Redis 之父用 C 语言重新发明本地推理——从磁盘 KV 一等公民到 284B 模型跑进 MacBook 的工程完全指南(2026)
编程
DwarfStar 4 深度实战:当 Redis 之父用 C 语言重新发明本地推理——从磁盘 KV 一等公民到 284B 模型跑进 MacBook 的工程完全指南(2026)
2026-06-14 09:48:41 +0800 CST
view 295
Redis之父antirez的ds4项目深度解析:非对称2-bit量化、磁盘KV缓存一等公民、session_sync增量推理、方向引导、分布式推理的工程实战指南
ds4
DwarfStar
本地推理
DeepSeek
MoE
KV缓存
antirez
Metal
量化
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
编程
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
2026-04-24 17:19:28 +0800 CST
view 510
2026年4月24日DeepSeek发布V4预览版,总参1.6T/284B,激活49B/13B,100万Token上下文,DSA稀疏注意力,兼容OpenAI+Anthropic双协议,昇腾与寒武纪Day 0适配,深度解析其架构与API用法。
DeepSeek
V4
MoE
大模型
开源
DwarfStar 深度解析:antirez 的 DeepSeek V4 Flash 本地推理引擎——Metal 与 CUDA 双轨优化革命(2026 完全指南)
编程
DwarfStar 深度解析:antirez 的 DeepSeek V4 Flash 本地推理引擎——Metal 与 CUDA 双轨优化革命(2026 完全指南)
2026-05-28 19:13:18 +0800 CST
view 343
DwarfStar(ds4)是Redis创始人antirez开发的DeepSeek V4 Flash专用推理引擎,支持Metal与CUDA双轨优化、磁盘KV Cache、imatrix量化和原生Agent集成。本文深入解析其架构设计与性能表现。
DeepSeek
ds4
Metal
CUDA
本地推理
MoE
量化
GGUF
Agent
Python
C
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
编程
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
2026-06-27 09:15:20 +0800 CST
view 61
百度开源 Unlimited OCR,5天 GitHub Star 破万。本文深度解析其核心创新 R-SWA(Reference Sliding Window Attention),如何将解码器 KV Cache 从线性增长压成常数,OmniDocBench v1.6 刷榜 SOTA(93.92%),30B 总参/5B 激活,32K 超长上下文,一次前向全稿转录,附完整代码实战。
Unlimited OCR
R-SWA
KV Cache
MoE
端到端 OCR
百度
深度学习
Transformer
文档识别
OCR
GLM-5.2 深度解析:百万上下文 + 异步Agent RL + MIT开源,国产大模型里程碑级突破
编程
GLM-5.2 深度解析:百万上下文 + 异步Agent RL + MIT开源,国产大模型里程碑级突破
2026-06-27 18:46:30 +0800 CST
view 91
智谱AI发布GLM-5.2旗舰开源大模型:744B MoE架构+40B激活参数、1M百万Token稳定上下文、异步Agent RL训练、IndexShare稀疏注意力将计算量降低2.9倍。SWE-bench Pro编程能力超越GPT-5.5,MIT协议完全开源。本文深度解析其技术架构、训练方法、性能评测与生产实践。
GLM-5.2
Z.ai
开源大模型
MoE
异步Agent RL
百万上下文
MIT协议
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
编程
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
2026-04-26 08:10:21 +0800 CST
view 546
深度解析DeepSeek-V4的技术突破:百万Token原生上下文、万亿级MoE架构、国产芯片适配。从技术原理到工程实践,全面剖析这场开源AI的革命。
DeepSeek
大模型
MoE
百万上下文
开源AI
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
编程
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
2026-06-28 06:43:54 +0800 CST
view 79
百度2026年6月开源Unlimited OCR:30亿参数仅激活5亿,R-SWA注意力把KV Cache压成常数,一次前向推理处理几十页文档,OmniDocBench v1.6得分93.92%刷新SOTA。
百度 Unlimited OCR
OCR
R-SWA
长文档
端到端
MoE
SGLang
GLM-5.2 深度实战:当开源编程模型首次摸到 Opus 4.8 的天花板——从 753B MoE 架构到 1M 无损上下文、从 DSA 稀疏注意力到国产算力 Day-0 部署的生产级完全指南(2026)
编程
GLM-5.2 深度实战:当开源编程模型首次摸到 Opus 4.8 的天花板——从 753B MoE 架构到 1M 无损上下文、从 DSA 稀疏注意力到国产算力 Day-0 部署的生产级完全指南(2026)
2026-06-20 15:52:19 +0800 CST
view 241
GLM-5.2 开源深度解析:753B MoE 架构、1M 无损上下文、DSA 稀疏注意力、生产级部署完全指南
AI
开源模型
GLM
智谱
编程工具
MoE
大模型
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
编程
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
2026-05-30 15:42:55 +0800 CST
view 291
深度解析 LLM 推理优化的核心技术:PagedAttention 内存管理革命、投机解码加速策略、INT4/FP8 量化技术、MoE 架构优化,从架构原理到代码实战,让大模型推理成本下降 70%。
LLM
推理优化
vLLM
PagedAttention
投机解码
量化
MoE
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
编程
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
2026-06-28 14:13:06 +0800 CST
view 86
深度解析百度 Unlimited OCR 的 R-SWA 参考滑动窗口注意力机制,如何将 KV Cache 从线性增长压到常数,使长文档 OCR 性能恒定不衰减。含完整架构分析、训练配方、性能基准和实战代码。
Unlimited OCR
R-SWA
OCR
端到端
百度
文档识别
KV Cache
MoE
DeepEncoder
长文档处理
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 519
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
...
11
下一页