程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
百度 Unlimited OCR 深度解析:R-SWA 把 KV Cache 压成常数,长文档 OCR 终于迎来「一次看完」时代
编程
百度 Unlimited OCR 深度解析:R-SWA 把 KV Cache 压成常数,长文档 OCR 终于迎来「一次看完」时代
2026-06-29 15:13:32 +0800 CST
view 30
百度 Unlimited OCR 用 R-SWA 机制把 KV Cache 压成常数,首次实现 40+ 页文档单次前向解析。深度解析 R-SWA 原理、模型架构、性能基准与实战部署。
百度
Unlimited OCR
OCR
R-SWA
KV Cache
长文档
端到端OCR
DeepEncoder
MoE
参考滑动窗口注意力
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
编程
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
2026-06-27 09:15:20 +0800 CST
view 61
百度开源 Unlimited OCR,5天 GitHub Star 破万。本文深度解析其核心创新 R-SWA(Reference Sliding Window Attention),如何将解码器 KV Cache 从线性增长压成常数,OmniDocBench v1.6 刷榜 SOTA(93.92%),30B 总参/5B 激活,32K 超长上下文,一次前向全稿转录,附完整代码实战。
Unlimited OCR
R-SWA
KV Cache
MoE
端到端 OCR
百度
深度学习
Transformer
文档识别
OCR
百度 Unlimited OCR 深度解析:R-SWA 如何把 KV Cache 从线性增长压成常数,端到端 OCR 的长文档革命
编程
百度 Unlimited OCR 深度解析:R-SWA 如何把 KV Cache 从线性增长压成常数,端到端 OCR 的长文档革命
2026-06-29 19:45:14 +0800 CST
view 23
深度解析百度开源的 Unlimited OCR:R-SWA 如何把 KV Cache 从线性增长压成常数,解决长文档 OCR 的失忆问题,OmniDocBench v1.6 刷新 SOTA 93.92%
Unlimited OCR
百度
OCR
端到端
长文档
R-SWA
开源
深度学习
文档解析
Markdown
百度 Unlimited-OCR 深度解析:R-SWA 注意力机制如何用 3B 参数打爆百亿模型
编程
百度 Unlimited-OCR 深度解析:R-SWA 注意力机制如何用 3B 参数打爆百亿模型
2026-06-30 16:16:03 +0800 CST
view 13
2026年6月百度开源Unlimited-OCR深度解析:R-SWA参考滑动窗口注意力机制将KV Cache从线性增长压成常数,3B MoE模型用500M激活参数在OmniDocBench上以93.92%总分刷新SOTA,打爆Qwen3-VL 72B和Gemini 2.5 Pro。万字长文从架构原理到代码实战全覆盖。
Unlimited-OCR
端到端OCR
R-SWA
百度
注意力机制
大模型
MoE
深度学习
AI开源
文档解析
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
编程
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
2026-06-27 02:13:37 +0800 CST
view 118
深度解析百度2026年6月开源的Unlimited OCR模型,介绍其R-SWA机制如何解决长文档OCR的KV cache线性增长问题,包含完整实战代码和性能优化技巧。
Unlimited OCR
百度
OCR
深度学习
MoE
R-SWA
长文档解析
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
编程
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
2026-06-28 06:43:54 +0800 CST
view 67
百度2026年6月开源Unlimited OCR:30亿参数仅激活5亿,R-SWA注意力把KV Cache压成常数,一次前向推理处理几十页文档,OmniDocBench v1.6得分93.92%刷新SOTA。
百度 Unlimited OCR
OCR
R-SWA
长文档
端到端
MoE
SGLang
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
编程
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
2026-06-28 14:13:06 +0800 CST
view 76
深度解析百度 Unlimited OCR 的 R-SWA 参考滑动窗口注意力机制,如何将 KV Cache 从线性增长压到常数,使长文档 OCR 性能恒定不衰减。含完整架构分析、训练配方、性能基准和实战代码。
Unlimited OCR
R-SWA
OCR
端到端
百度
文档识别
KV Cache
MoE
DeepEncoder
长文档处理
SwanLab 深度实战:当国产开源 AI 训练跟踪工具遇见 W&B 替代方案——从 PyTorch 全链路监控到私有化部署、从硬件感知到多框架集成的生产级完全指南(2026)
编程
SwanLab 深度实战:当国产开源 AI 训练跟踪工具遇见 W&B 替代方案——从 PyTorch 全链路监控到私有化部署、从硬件感知到多框架集成的生产级完全指南(2026)
2026-06-21 18:24:22 +0800 CST
view 114
深度解析 SwanLab——国产开源 AI 训练跟踪工具,对标 W&B 和 MLflow。涵盖架构设计、PyTorch/Transformers/LLaMA Factory 集成、硬件全链路监控、实验对比、私有化部署(Docker/K8s)、SDK v0.8.0 性能优化等内容。
SwanLab
AI训练
PyTorch
W&B替代
MLflow
实验跟踪
硬件监控
私有化部署
Google LangExtract 深度解析:用LLM实现非结构化文本的精准结构化提取与可视化
编程
Google LangExtract 深度解析:用LLM实现非结构化文本的精准结构化提取与可视化
2026-05-17 19:18:49 +0800 CST
view 334
Google LangExtract库深度解析,介绍如何使用LLM从非结构化文本中精准提取结构化信息,包含精确源接地、交互式可视化、代码实战和性能优化。
LLM
信息提取
Google
Python
NLP
Google LangExtract 深度实战:LLM结构化信息提取的完整指南(2026版)
编程
Google LangExtract 深度实战:LLM结构化信息提取的完整指南(2026版)
2026-05-17 19:30:29 +0800 CST
view 322
2026年最新Google LangExtract深度实战指南,全面解析如何用LLM从非结构化文本中精准提取结构化信息,包含精确源接地、交互式可视化、代码实战和性能优化。
LLM
信息提取
Google
Python
NLP
结构化数据
Change Data Capture 深度实战:从数据库 Binlog 到实时数据管道——2026 年事件驱动架构的完全指南
编程
Change Data Capture 深度实战:从数据库 Binlog 到实时数据管道——2026 年事件驱动架构的完全指南
2026-06-26 13:45:22 +0800 CST
view 55
2026年Change Data Capture(CDC)深度实战指南:从MySQL Binlog原理到Debezium+Kafka生产级部署,从Flink实时入湖到缓存失效模式,覆盖七大架构决策、性能调优与生产踩坑,万字长文带你掌握现代数据管道核心范式。
Change Data Capture
CDC
Debezium
Kafka
数据库
实时同步
事件驱动
MySQL Binlog
Flink
数据管道
CDC(变更数据捕获)深度实战:从数据库 Binlog 到事件驱动架构——2026 年实时数据管道完全指南
编程
CDC(变更数据捕获)深度实战:从数据库 Binlog 到事件驱动架构——2026 年实时数据管道完全指南
2026-06-26 13:46:07 +0800 CST
view 84
2026年Change Data Capture(CDC)深度实战指南:从MySQL Binlog原理到Debezium+Kafka生产级部署,从Flink实时入湖到缓存失效模式,覆盖七大架构决策、性能调优与生产踩坑,万字长文带你掌握现代数据管道核心范式。
Change Data Capture
CDC
Debezium
Kafka
数据库
实时同步
事件驱动
MySQL Binlog
Flink
数据管道
Google LangExtract 深度解析:用 LLM 从非结构化文本精准提取结构化信息——28K Star 的谷歌开源利器架构内幕
编程
Google LangExtract 深度解析:用 LLM 从非结构化文本精准提取结构化信息——28K Star 的谷歌开源利器架构内幕
2026-05-18 18:48:34 +0800 CST
view 292
Google LangExtract 深度解析,28K Star 开源项目,用 LLM 从非结构化文本中精准提取结构化信息,支持源文本定位、幻觉检测、交互式可视化
LLM
信息提取
Google
开源项目
NLP
Python
Anthropic 22亿收购Stainless:当SDK自动生成成为AI战争的战略高地
编程
Anthropic 22亿收购Stainless:当SDK自动生成成为AI战争的战略高地
2026-05-19 15:49:10 +0800 CST
view 411
Anthropic以超过22亿元收购Stainless,独占SDK自动生成与MCP服务器生成基础设施,深度解析技术架构与行业影响
Anthropic
Stainless
SDK
MCP
AI工具链
OpenAPI
yas,一个开源的C++库:比Protobuf快10倍的序列化方案
代码
yas,一个开源的C++库:比Protobuf快10倍的序列化方案
2026-06-28 07:14:32 +0800 CST
view 49
YAS是C++ header-only序列化库,纯头文件零依赖,性能比Protobuf快10倍,支持二进制/文本/JSON三种格式,适合游戏存档和网络协议等高性能场景。
C++
序列化
性能优化
开源
header-only
二进制
Google LangExtract 深度实战:让 LLM 从"黑盒"变"透明"——从架构原理到生产级结构化提取完全指南(2026)
编程
Google LangExtract 深度实战:让 LLM 从"黑盒"变"透明"——从架构原理到生产级结构化提取完全指南(2026)
2026-05-30 15:10:01 +0800 CST
view 245
Google LangExtract 深度实战:从架构原理、核心源码、代码实战到生产级部署,全面掌握这款让LLM从"黑盒"变"透明"的神器。
LLM
Google
Python
结构化提取
NLP
信息抽取
开源项目
AI工程化
Google LangExtract 深度实战:当 LLM 学会「精准定位」——从非结构化文本到结构化数据的完全指南(2026)
编程
Google LangExtract 深度实战:当 LLM 学会「精准定位」——从非结构化文本到结构化数据的完全指南(2026)
2026-06-09 16:19:31 +0800 CST
view 152
Google LangExtract 深度实战教程,详解如何从非结构化文本中提取结构化信息,包含精确源定位、交互式可视化、长文档优化等核心特性,附完整代码示例。
LLM
信息提取
Python
Google
NLP
Anthropic 3亿美元收购Stainless:一文看懂AI开发工具链的「咽喉」战略
编程
Anthropic 3亿美元收购Stainless:一文看懂AI开发工具链的「咽喉」战略
2026-05-21 23:20:55 +0800 CST
view 389
2026年5月Anthropic以超3亿美元收购Stainless,这家被OpenAI和Google共用的SDK生成工具公司,为何成为AI巨头的兵家必争之地?本文深度解析SDK生成引擎架构、MCP协议原理,以及这场收购对整个AI开发生态的深远影响。
Anthropic
Stainless
MCP
SDK生成
AI工具链
Bun 2026 深度解析:重构 JavaScript 工具链的野心——性能、体验、生态三维发力,建立全新范式
编程
Bun 2026 深度解析:重构 JavaScript 工具链的野心——性能、体验、生态三维发力,建立全新范式
2026-05-14 04:14:38 +0800 CST
view 438
Bun 2026深度解析:v1.3.6-v1.3.9密集迭代重构JavaScript工具链,Bun.password密码哈希内置、Bun.sqlite SQLite集成内置、Bun.shell跨平台Shell脚本、性能比Node.js 22快4倍,生态三维发力建立全新范式。
Bun2026,JavaScript工具链,性能优化,生态重构,Bun.password,Bun.sqlite,Bun.shell
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
编程
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
2026-05-10 00:41:20 +0800 CST
view 343
Docker 27 Orion深度解析:GPU拓扑感知调度与PCIe/NVLink自动绑定、NUMA内存带宽限制、dockerd-scheduler AI调度代理、docker ai run零配置LLM部署、Dockerfile.ai模型封装语法、OOM Killer五步防御、cgroups v2集成与生产环境避坑指南
Docker
容器化
GPU调度
NUMA
AI推理
LLM
docker-compose
cgroups
Dockerfile
NVIDIA
Bun 1.3 深度实战:当 JavaScript 运行时进化为全栈操作系统——从内置 Redis/MySQL 到生产级全栈开发完全指南(2026)
编程
Bun 1.3 深度实战:当 JavaScript 运行时进化为全栈操作系统——从内置 Redis/MySQL 到生产级全栈开发完全指南(2026)
2026-06-05 17:14:51 +0800 CST
view 207
Bun 1.3 深度解析:内置 Redis/MySQL/PostgreSQL/SQLite 客户端、前端 HMR 开发服务器、参数化路由、全栈编译为独立可执行文件
Bun
JavaScript
Redis
MySQL
PostgreSQL
SQLite
全栈开发
前端
运行时
Redis 8.8 深度实战:当原生Array遇见原子限流——从新数据结构到字段级通知、Stream消息回收与多聚合时序查询的生产级完全指南(2026)
编程
Redis 8.8 深度实战:当原生Array遇见原子限流——从新数据结构到字段级通知、Stream消息回收与多聚合时序查询的生产级完全指南(2026)
2026-06-17 12:53:51 +0800 CST
view 161
Redis 8.8 GA 版本深度解析:原生 Array、原子限流 INCREX、Stream 消息回收 XNACK、Hash 字段级通知、多聚合时序查询等核心特性,含完整代码示例
Redis
Redis 8.8
Array
INCREX
XNACK
限流
Streams
GLM-OCR 深度解析:0.9B 参数的文档理解小钢炮,OmniDocBench 拿下 94.62 分的秘密
编程
GLM-OCR 深度解析:0.9B 参数的文档理解小钢炮,OmniDocBench 拿下 94.62 分的秘密
2026-05-13 22:15:56 +0800 CST
view 317
GLM-OCR是智谱AI推出的0.9B参数文档理解多模态模型,凭借布局感知两阶段流水线和GRPO强化学习,在OmniDocBench v1.5以94.62分领先。本文深度解析其CogViT架构、MTP解码加速、印章识别技术及完整部署实战。
GLM-OCR,智谱AI,OCR,多模态模型,文档理解
PaddleOCR深度解析:登顶GitHub全球OCR王座,500万参数如何击败十亿参数视觉大模型
编程
PaddleOCR深度解析:登顶GitHub全球OCR王座,500万参数如何击败十亿参数视觉大模型
2026-04-18 08:16:02 +0800 CST
view 383
深入解析百度PaddleOCR登顶GitHub全球OCR项目Star第一的技术密码,剖析PP-OCRv5仅500万参数媲美十亿参数视觉大模型的工程奥秘
OCR
PaddleOCR
深度学习
百度
开源
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
48
下一页