程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
万字深度解析 DeepSeek V4:当 1.6 万亿参数遇见 DSA 稀疏注意力——开源大模型如何让 API 账单暴降 95%(2026)
编程
万字深度解析 DeepSeek V4:当 1.6 万亿参数遇见 DSA 稀疏注意力——开源大模型如何让 API 账单暴降 95%(2026)
2026-07-01 07:13:58 +0800 CST
view 85
2026年4月DeepSeek V4发布,1.6万亿参数+百万上下文+SWE-Bench 80.6%,API成本暴降95%。深度解析DSA稀疏注意力、MoE架构、生产级部署实战。
DeepSeek V4
DSA 稀疏注意力
MoE 架构
百万上下文
开源大模型
API 成本优化
大模型部署
Agent 能力
SWE-Bench
DeepSeek
MiroFish 深度实战:从群体智能引擎到预测即服务——2026 年通用 Swarm Intelligence 完全指南
编程
MiroFish 深度实战:从群体智能引擎到预测即服务——2026 年通用 Swarm Intelligence 完全指南
2026-05-24 12:29:21 +0800 CST
view 431
深度剖析 MiroFish 群体智能引擎的架构设计与实战应用,涵盖动态权重调整、多 Agent 协同、股票预测案例与生产级调优策略。
MiroFish
群体智能
Swarm Intelligence
预测引擎
Python
Linux Swap 子系统现代化重构:当 18 个月的内核攻坚重塑内存管理底层架构
编程
Linux Swap 子系统现代化重构:当 18 个月的内核攻坚重塑内存管理底层架构
2026-04-13 06:55:20 +0800 CST
view 679
深入剖析腾讯工程师主导的 Linux Swap 子系统现代化重构——从 XArray 到 swap table,从 swap map 到统一元数据管理,这场跨越 18 个月的内核级架构革新带来 5%-20% 性能提升和 30% 元数据内存节省。
Linux
内核
内存管理
Swap
性能优化
万字深度解析百度 Unlimited OCR:当 R-SWA 注意力机制让端到端 OCR 一次性解析数十页文档——从架构设计到生产级部署完整指南(2026)
编程
万字深度解析百度 Unlimited OCR:当 R-SWA 注意力机制让端到端 OCR 一次性解析数十页文档——从架构设计到生产级部署完整指南(2026)
2026-07-01 15:43:34 +0800 CST
view 72
2026年6月百度开源Unlimited OCR深度解析:R-SWA参考滑动窗口注意力机制将KV Cache压为常数,3B参数(500M激活)在OmniDocBench以93.92%刷新SOTA,单次解析40+页文档。从架构设计到生产级部署完整技术指南。
Unlimited-OCR
R-SWA
百度
端到端OCR
大模型
MoE
DeepEncoder
性能优化
开源项目
Python
阿里巴巴 zvec 深度解析:让向量搜索回归进程内的极致性能之道
编程
阿里巴巴 zvec 深度解析:让向量搜索回归进程内的极致性能之道
2026-04-23 05:10:48 +0800 CST
view 624
深度解析阿里巴巴开源的轻量级进程内向量数据库zvec,从Proxima引擎架构、RabitQ量化算法、HNSW索引优化、WAL持久化到SIMD自动分发,含完整Python/Node.js代码实战与性能对比
zvec
向量数据库
Proxima
RabitQ
HNSW
嵌入式数据库
AI
向量检索
MiniMax M2.7 深度解析:当 AI 模型开始自己训练自己——从自我进化架构到软件工程能力全面评测
编程
MiniMax M2.7 深度解析:当 AI 模型开始自己训练自己——从自我进化架构到软件工程能力全面评测
2026-04-13 19:57:01 +0800 CST
view 1265
MiniMax M2.7 开源模型深度解析:自我进化架构、SWE-Pro 56.22% 软件工程能力、OpenRoom 多模态交互、本地部署方案与开源协议争议全面剖析。
AI
大模型
MiniMax
自我进化
开源
SWE-Pro
万字深度解析百度 Unlimited-OCR:当端到端OCR遇见R-SWA革命,从逐页失忆到40页文档一口气解析(2026)
编程
万字深度解析百度 Unlimited-OCR:当端到端OCR遇见R-SWA革命,从逐页失忆到40页文档一口气解析(2026)
2026-07-02 10:46:07 +0800 CST
view 40
深度解析百度2026年开源的Unlimited-OCR模型:3B参数的端到端OCR系统,R-SWA机制实现常数级KV缓存,OmniDocBench 93.92% SOTA评分,可一口气解析40页文档
Unlimited-OCR
百度
OCR
R-SWA
MoE
CLIP
端到端
长文档处理
深度学习
多模态
R-SWA如何让OCR「过目不忘」:百度Unlimited-OCR的KV缓存革命与40页长文档解析实战(2026)
编程
R-SWA如何让OCR「过目不忘」:百度Unlimited-OCR的KV缓存革命与40页长文档解析实战(2026)
2026-07-02 10:47:12 +0800 CST
view 47
深度解析百度2026年开源的Unlimited-OCR模型:3B参数的端到端OCR系统,R-SWA机制实现常数级KV缓存,OmniDocBench 93.92% SOTA评分,可一口气解析40页文档
Unlimited-OCR
百度
OCR
R-SWA
MoE
CLIP
端到端
长文档处理
深度学习
多模态
CC Switch:一个桌面应用统一管理你的多个CLI工具
编程
CC Switch:一个桌面应用统一管理你的多个CLI工具
2026-05-13 17:54:00 +0800 CST
view 423
CC Switch是基于Tauri 2构建的跨平台桌面应用,一个界面统一管理Claude Code/Codex/Gemini CLI/OpenCode/OpenClaw等AI编程CLI工具。50+供应商预设一键切换,MCP和Skills统一管理面板,云同步多设备配置。
CC Switch
AI编程
CLI管理
Tauri
MCP
首超人类!Agent S3:OSWorld基准测试72.60%的计算机使用智能体
案例
首超人类!Agent S3:OSWorld基准测试72.60%的计算机使用智能体
2026-05-06 07:15:01 +0800 CST
view 367
Agent S3首超人类!OSWorld基准测试72.60%,11K+Star开源计算机使用智能体,支持Mac/Windows/Linux,ICLR 2025 Best Paper,超越OpenAI Operator和Claude Computer-Use
AI Agent
计算机使用
OSWorld
SOTA
Agent S3
GUI自动化
Simular
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
编程
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
2026-06-27 02:13:37 +0800 CST
view 198
深度解析百度2026年6月开源的Unlimited OCR模型,介绍其R-SWA机制如何解决长文档OCR的KV cache线性增长问题,包含完整实战代码和性能优化技巧。
Unlimited OCR
百度
OCR
深度学习
MoE
R-SWA
长文档解析
阿里巴巴 ZVec 深度解析:用 C++ 打造进程内向量数据库,为什么说它是向量界的 SQLite?
编程
阿里巴巴 ZVec 深度解析:用 C++ 打造进程内向量数据库,为什么说它是向量界的 SQLite?
2026-04-24 01:13:36 +0800 CST
view 429
阿里巴巴开源的进程内向量数据库 ZVec 深度解析:从架构设计、WAL存储引擎、HNSW/RabitQ索引到RAG实战,对比Chroma/FAISS/Milvus,为什么说它是向量界的SQLite?
ZVec
向量数据库
C++
RabitQ
HNSW
进程内数据库
RAG
万字深度解析百度 Unlimited OCR:当长文档解析遇见 R-SWA 革命——从常数级 KV Cache 到 40 页一次性识别的完整技术指南(2026)
编程
万字深度解析百度 Unlimited OCR:当长文档解析遇见 R-SWA 革命——从常数级 KV Cache 到 40 页一次性识别的完整技术指南(2026)
2026-07-02 18:16:20 +0800 CST
view 55
深度解析百度 Unlimited OCR 的 R-SWA 参考滑动窗口注意力机制,将 KV Cache 从线性增长压至常数级;3B MoE 解码器架构、DeepEncoder 视觉编码器;完整本地部署代码、KV Cache 监控脚本与 SGLang 生产推理优化指南。OmniDocBench v1.6 综合得分 93.92%,端到端 OCR 新 SOTA。
OCR
R-SWA
KV Cache
MoE
百度
长文档解析
Transformer
深度学习
Python
性能优化
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
编程
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
2026-06-27 09:15:20 +0800 CST
view 93
百度开源 Unlimited OCR,5天 GitHub Star 破万。本文深度解析其核心创新 R-SWA(Reference Sliding Window Attention),如何将解码器 KV Cache 从线性增长压成常数,OmniDocBench v1.6 刷榜 SOTA(93.92%),30B 总参/5B 激活,32K 超长上下文,一次前向全稿转录,附完整代码实战。
Unlimited OCR
R-SWA
KV Cache
MoE
端到端 OCR
百度
深度学习
Transformer
文档识别
OCR
Claude Code官方桌面端正式发布,实时预览太强了
编程
Claude Code官方桌面端正式发布,实时预览太强了
2026-05-29 04:15:00 +0800 CST
view 414
Claude Code Desktop是Anthropic官方推出的桌面应用程序,集成Chat、Cowork和Code三大核心功能,免登录即可使用。最惊艳的功能是Claude Preview,改完代码自动起开发服务器,在内嵌浏览器里实时看效果。
Claude Code
桌面端
Anthropic
AI编程
Claude Preview
CC Switch
前端开发
实时预览
百度 Unlimited OCR 深度解析:端到端长文档 OCR 的新范式——从 R-SWA 机制到 3B 参数模型、从 KV Cache 压缩到生产级部署的完整技术指南(2026)
编程
百度 Unlimited OCR 深度解析:端到端长文档 OCR 的新范式——从 R-SWA 机制到 3B 参数模型、从 KV Cache 压缩到生产级部署的完整技术指南(2026)
2026-07-04 03:13:57 +0800 CST
view 28
2026年6月百度开源Unlimited OCR,5天GitHub Star破1万。深度解析R-SWA机制、3B参数模型架构、KV Cache压缩原理,含完整部署代码与生产级应用案例。
百度
Unlimited OCR
OCR
R-SWA
KV Cache
长文档识别
端到端OCR
多模态模型
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
编程
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
2026-06-28 06:43:54 +0800 CST
view 145
百度2026年6月开源Unlimited OCR:30亿参数仅激活5亿,R-SWA注意力把KV Cache压成常数,一次前向推理处理几十页文档,OmniDocBench v1.6得分93.92%刷新SOTA。
百度 Unlimited OCR
OCR
R-SWA
长文档
端到端
MoE
SGLang
Claude Code 接入 DeepSeek V4:十分之一价格,Opus 级性能,保姆级配置指南
编程
Claude Code 接入 DeepSeek V4:十分之一价格,Opus 级性能,保姆级配置指南
2026-04-27 07:06:28 +0800 CST
view 854
DeepSeek V4 性能对标 Claude Opus 4.6,价格不到十分之一。本文提供保姆级配置教程,包括 CC Switch 图形化工具和环境变量两种方式,实测 Flappy Bird 和待办管理两个真实任务的完整体验。
Claude Code
DeepSeek V4
AI编程
Anthropic API
CC Switch
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
编程
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
2026-06-28 14:13:06 +0800 CST
view 148
深度解析百度 Unlimited OCR 的 R-SWA 参考滑动窗口注意力机制,如何将 KV Cache 从线性增长压到常数,使长文档 OCR 性能恒定不衰减。含完整架构分析、训练配方、性能基准和实战代码。
Unlimited OCR
R-SWA
OCR
端到端
百度
文档识别
KV Cache
MoE
DeepEncoder
长文档处理
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
编程
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
2026-04-09 00:53:51 +0800 CST
view 1244
2026年4月8日智谱发布GLM-5.1,744B参数MIT开源,SWE-bench Pro 58.4分超越Claude Opus 4.6,全球首个支持8小时长程自治的开源模型。
GLM-5.1
智谱AI
开源大模型
MoE
SWE-bench
长程自治
LLM
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
编程
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
2026-06-15 21:20:49 +0800 CST
view 170
深入解析小米MiMo UltraSpeed如何通过SWA架构在通用GPU上突破1000 tokens/s推理速度,从O(n²)困境到极致跨越的完整技术指南。
SWA
Sliding Window Attention
LLM推理
小米MiMo
推理优化
Transformer
PagedAttention
量化推理
端侧AI
Deno 2.9 深度解析:deno desktop 开辟全栈一体化新赛道,从桌面应用到性能革命的完整技术指南
编程
Deno 2.9 深度解析:deno desktop 开辟全栈一体化新赛道,从桌面应用到性能革命的完整技术指南
2026-07-03 11:15:04 +0800 CST
view 49
深度解析 Deno 2.9 核心更新:deno desktop 构建原生桌面应用、启动速度 2 倍提升、内存占用降低 3.1 倍、HTTP 吞吐量提升 1.27 倍,含完整代码实战与架构分析
Deno
deno desktop
TypeScript
JavaScript
桌面应用
性能优化
WebAssembly
V8
eBPF 可观测性实战:从内核探针到云原生全链路监控的深度指南
编程
eBPF 可观测性实战:从内核探针到云原生全链路监控的深度指南
2026-07-05 10:44:02 +0800 CST
view 19
深入解析 eBPF 在云原生可观测性中的应用,涵盖 kprobes/tracepoints/XDP 探针机制、BPF Maps 数据通信、Go Agent 开发、Kubernetes Pod 关联、性能优化策略及生产实战案例。
eBPF
可观测性
云原生
Kubernetes
内核追踪
XDP
kprobes
tracepoints
Cilium
Hubble
WebAssembly + WASI 云原生深度解析:从 Docker 原生运行到边缘 AI 部署的完整技术架构
编程
WebAssembly + WASI 云原生深度解析:从 Docker 原生运行到边缘 AI 部署的完整技术架构
2026-05-17 10:43:55 +0800 CST
view 358
深入解析 WebAssembly 与 WASI 标准在云原生场景下的技术原理,涵盖 Docker Engine 26.0 原生 WASM 支持、三大主流运行时对比、三种部署范式实测性能,以及边缘 AI 推理的完整实战指南。
WebAssembly
WASI
Docker
Kubernetes
边缘计算
云原生
Rust
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
3
4
5
6
7
...
60
下一页