程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
编程
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
2026-06-28 14:13:06 +0800 CST
view 4
深度解析百度 Unlimited OCR 的 R-SWA 参考滑动窗口注意力机制,如何将 KV Cache 从线性增长压到常数,使长文档 OCR 性能恒定不衰减。含完整架构分析、训练配方、性能基准和实战代码。
Unlimited OCR
R-SWA
OCR
端到端
百度
文档识别
KV Cache
MoE
DeepEncoder
长文档处理
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
编程
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
2026-06-27 02:13:37 +0800 CST
view 48
深度解析百度2026年6月开源的Unlimited OCR模型,介绍其R-SWA机制如何解决长文档OCR的KV cache线性增长问题,包含完整实战代码和性能优化技巧。
Unlimited OCR
百度
OCR
深度学习
MoE
R-SWA
长文档解析
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
编程
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
2026-06-28 06:43:54 +0800 CST
view 16
百度2026年6月开源Unlimited OCR:30亿参数仅激活5亿,R-SWA注意力把KV Cache压成常数,一次前向推理处理几十页文档,OmniDocBench v1.6得分93.92%刷新SOTA。
百度 Unlimited OCR
OCR
R-SWA
长文档
端到端
MoE
SGLang
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 423
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 507
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
综合
markdown语法
2024-11-18 18:38:43 +0800 CST
view 3817
Markdown是一种轻量级标记语言,以纯文本形式编写文档并可转换为HTML格式。由AaronSwartz和JohnGruber设计,因其易读、易写、易更改而受到广泛使用。Markdown支持多种语法,如标题、段落、引用、代码块等,适用于多种平台和工具,越来越多的网站和应用程序支持Markdown,方便用户组织内容。
编程
文档
技术
工具
网络
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
编程
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
2026-06-16 04:47:57 +0800 CST
view 169
深度实战微软开源神器MarkItDown:从多格式文档解析到LLM友好Markdown转换,涵盖RAG系统构建、MCP集成、批量处理优化、生产级API服务部署,10000字完整指南。
MarkItDown
文档转换
Markdown
RAG
LLM
MCP
AI Agent
Python
综合
Reader-LM: 将 HTML 转化为 Markdown 的革命性工具
2024-11-18 11:00:51 +0800 CST
view 2138
Reader-LM是由JinaAI推出的一个小型语言模型,专门用于将HTML转换为干净的Markdown格式。它具备智能内容提取、格式转换和多语言支持等功能,具有轻量级、高性能和长上下文支持的特点。使用简单,提供高性价比,适合处理长文本。用户可以通过HuggingFace模型库和GoogleColab体验其强大功能,并将在AzureMarketplace和AWSSageMaker上线。
工具
技术
编程
文档转换
人工智能
MarkItDown深度解析:微软开源10万星文档转Markdown神器,RAG知识库的终极数据入口
编程
MarkItDown深度解析:微软开源10万星文档转Markdown神器,RAG知识库的终极数据入口
2026-04-19 00:15:20 +0800 CST
view 530
微软AutoGen团队开源的MarkItDown,支持20+格式一键转Markdown,内置OCR和语音转写,专为LLM/RAG/知识库设计。10万星项目的深度技术解析,包含架构设计、代码实战、性能优化全攻略。
MarkItDown
微软
开源
RAG
文档转换
OCR
Python
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
编程
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
2026-04-28 21:16:14 +0800 CST
view 463
深度解析 GitHub 19K Star 的 RAG-Anything 多模态 RAG 框架:All-in-One 架构设计、MinerU 文档解析、多模态知识图谱、向量-图谱融合检索,完整覆盖从原理到生产部署的技术细节。
RAG
多模态
知识图谱
LightRAG
MinerU
AI
向量检索
文档处理
Nginx 负载均衡
编程
Nginx 负载均衡
2024-11-19 10:03:14 +0800 CST
view 1736
Nginx是一款高性能的反向代理服务器,支持负载均衡功能,通过配置后端服务器组和选择负载均衡算法,可以有效分发流量,提高系统性能和可用性。本文介绍了Nginx负载均衡的配置步骤、示例及不同算法的选择,帮助用户根据需求实现动态负载均衡。
服务器
网络
性能优化
技术文档
MarkItDown 深度实战:微软开源文档转换工具终结 RAG 数据准备之痛——从 PDF 到 Markdown 的生产级完全指南(2026)
编程
MarkItDown 深度实战:微软开源文档转换工具终结 RAG 数据准备之痛——从 PDF 到 Markdown 的生产级完全指南(2026)
2026-06-10 17:46:59 +0800 CST
view 123
微软开源的 MarkItDown 工具如何解决 RAG 数据准备的核心痛点,深度解析 PDF、Word、Excel 等文档格式转换的生产级实践
MarkItDown
RAG
PDF
python
Microsoft
文档转换
编程
MarkItDown 深度实战:微软 AutoGen 团队开源的万能文档转 Markdown 引擎——从四层架构到 LLM/RAG 生产级集成的完全指南(2026)
2026-06-02 08:52:38 +0800 CST
view 227
微软AutoGen团队开源的MarkItDown能将PDF、Word、PPT、Excel、图片、音频等20+格式一键转为LLM友好的结构化Markdown。本文从四层架构、源码解析、代码实战、性能优化到生产级部署,彻底拆解这一11.9万星开源项目的核心技术。
MarkItDown
Microsoft
文档转换
Markdown
LLM
RAG
AutoGen
Python
微软开源文档转换神器 MarkItDown:58K+ Star 的 Markdown 工具,支持 MCP 协议
编程
微软开源文档转换神器 MarkItDown:58K+ Star 的 Markdown 工具,支持 MCP 协议
2025-06-05 23:01:13 +0800 CST
view 1592
MarkItDown是微软开源的文档转换工具,支持多种文件格式(如PDF、Office、图片、音频等)转换为结构化的Markdown文档,适用于AI大模型和文本分析。该工具在GitHub上获得了超过58K的Star,提供了命令行和PythonAPI使用方式,并支持MarkdownConversionProtocol(MCP)。尽管在处理复杂格式时可能存在限制,但其多格式支持使其成为开发者的有力工具。
开源工具
文档处理
人工智能
文本分析
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
编程
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
2026-04-19 17:14:36 +0800 CST
view 584
深度解析微软开源工具 MarkItDown,10.8万星GitHub热门项目,解决 LLM 文档处理的世纪难题。支持20+格式一键转Markdown,MCP协议与AI工具深度集成。
MarkItDown
Markdown
Python
微软
LLM
MCP
RAG
文档处理
JSDoc是一个用于JavaScript的开源API文档生成器,允许开发者在源代码中添加注释并生成HTML文档
综合
JSDoc是一个用于JavaScript的开源API文档生成器,允许开发者在源代码中添加注释并生成HTML文档
2024-11-19 10:05:45 +0800 CST
view 1530
JSDoc是一个用于JavaScript的开源API文档生成器,允许开发者在源代码中添加注释并生成HTML文档。它提高了代码的可读性和维护性,支持多种标签如@param和@returns,能够与IDE集成,提升开发效率。通过npm安装后,开发者可以使用命令行工具生成文档,并可自定义模板和使用插件来增强功能。
JavaScript
开发工具
文档
API
开源
编程
MarkItDown 深度实战:当微软用 Python 把「文档地狱」变成 Markdown 乐园——从多格式解析到 RAG 知识库落地的生产级完全指南(2026)
2026-06-16 23:52:04 +0800 CST
view 152
微软开源MarkItDown深度实战:从多格式文档解析到RAG知识库落地的完全指南,涵盖PDF/Word/Excel/PPT转换、LangChain/LlamaIndex集成、性能优化与安全防护
MarkItDown
Python
RAG
文档转换
Markdown
LLM
知识库
微软
AI Agent
LangChain
Vue3 vue-office 插件实现 Word 预览
编程
Vue3 vue-office 插件实现 Word 预览
2024-11-19 02:19:34 +0800 CST
view 2301
本文介绍了如何在Vue3项目中使用vue-office插件实现Word文档的预览功能。通过创建Vue3项目、安装vue-office插件、设置响应式数据、使用组件以及实现文件上传预览,用户可以方便地展示Word文档。代码示例详细展示了每个步骤的实现方式。
前端开发
Vue
文档处理
编程
windows安装sphinx3.0.3(中文检索)
2024-11-17 05:23:31 +0800 CST
view 4622
Sphinx是一个高性能的全文检索引擎,支持SQL和XML数据源的集成,提供多种搜索接口。其索引速度可达10~15MB/秒,搜索性能可支持每秒150~250次查询。文中详细介绍了Sphinx的安装、配置文件的创建、索引的生成、服务的启动以及常用命令,适合需要实现高效搜索功能的开发者参考。
搜索引擎
数据库
技术文档
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
编程
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
2026-06-02 23:44:03 +0800 CST
view 335
Microsoft 开源的 MarkItDown 在 2026 年引爆 AI 工程圈。本文从源码级架构解析、多格式解析引擎、与 LLM 工具链的集成实战、性能优化到生产级 RAG 管道,全面拆解这款改变 AI 工程范式的工具。
Microsoft
MarkItDown
Markdown
LLM
RAG
Python
文档解析
AI工程
移动端 CSS 适配全攻略:从基础到进阶全面解析
编程
移动端 CSS 适配全攻略:从基础到进阶全面解析
2025-07-22 12:32:47 +0800 CST
view 1206
本文全面解析了移动端CSS适配的关键问题,包括viewport设置、1px物理像素问题、安全区域适配、字体缩放控制及rem方案等。通过具体的代码示例,提供了多种解决方案,帮助前端工程师应对不同设备的适配挑战,确保页面在各种屏幕上都能良好显示。
前端开发
移动开发
CSS
技术文档
响应式设计
编程
MarkItDown 深度实战:当微软用Python重写文档预处理——从转换器链到LLM集成的生产级完全指南(2026)
2026-06-12 13:48:19 +0800 CST
view 206
深度剖析微软开源的MarkItDown工具,详解其转换器链架构、插件系统、LLM集成和大规模文档处理性能优化,提供15个完整代码示例和生产级部署方案。
MarkItDown
文档预处理
LLM
RAG
Python
微软
编程
MonkeyOCR:国产开源OCR新星,结构化识别更高效
2025-07-22 18:09:30 +0800 CST
view 1495
MonkeyOCR是一款国产开源OCR工具,专注于高效的结构化识别,支持中英文复杂排版。其核心架构SRR三元组范式通过检测文档结构、进行高精度识别和推理结构关系,显著提升了识别准确率和速度。支持多种文档类型和应用场景,提供Docker一键部署和在线Demo体验,适合金融、科研和开发者使用。
OCR
开源软件
文档自动化
人工智能
技术工具
MarkItDown 深度拆解:微软如何用 Python 重新定义文档转换——从 89K Star 到 RAG 时代的「通用语」
编程
MarkItDown 深度拆解:微软如何用 Python 重新定义文档转换——从 89K Star 到 RAG 时代的「通用语」
2026-05-02 08:32:32 +0800 CST
view 343
微软AutoGen团队开源的markitdown工具深度解析,支持20+格式一键转Markdown,专为LLM/RAG场景优化,详解PDF/DOCX/PPTX转换原理与插件开发。
Python
AI
RAG
文档处理
开源
微软
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
下一页