程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
综合
pinyin-pro:功能强大的汉字拼音转换库,中文转拼音利器
2024-11-19 08:38:54 +0800 CST
view 2471
pinyin-pro是一个功能强大的JavaScript库,能够将中文文本准确快速地转换为拼音,支持拼音音调、声母、韵母的转换,并处理多音字和姓氏。它提供拼音匹配和中文分词功能,适用于搜索引擎优化、语音合成和汉语教学等场景。该库易于使用,性能优异,适合开发者和语言研究者。
中文处理
编程工具
开源项目
语言学习
文本处理
编程
更新了AI续写和AI纠错功能,并增加了AI补充参数的选项
2024-11-19 09:52:25 +0800 CST
view 1633
本文更新了AI续写和AI纠错功能,并增加了AI补充参数的选项。这些更新旨在提升用户体验和功能的灵活性,使得AI在文本生成和修正方面更加高效。
人工智能
文本处理
功能更新
ftfy是一个强大的Python库,用于自动检测和修复文本中的编码问题
综合
ftfy是一个强大的Python库,用于自动检测和修复文本中的编码问题
2024-11-18 23:40:21 +0800 CST
view 1917
ftfy是一个强大的Python库,用于自动检测和修复文本中的编码问题。它能够处理网络爬取的数据和用户输入,提供简单的安装和使用方法。核心功能包括修复错误的UTF-8编码、HTML实体和Windows-1252编码错误。ftfy还支持自定义修复策略和检测文本是否需要修复,适合大规模文本处理。它在数据清洗和自然语言处理领域具有重要应用。
Python
文本处理
数据分析
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 427
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
微软开源文档转换神器 MarkItDown:58K+ Star 的 Markdown 工具,支持 MCP 协议
编程
微软开源文档转换神器 MarkItDown:58K+ Star 的 Markdown 工具,支持 MCP 协议
2025-06-05 23:01:13 +0800 CST
view 1531
MarkItDown是微软开源的文档转换工具,支持多种文件格式(如PDF、Office、图片、音频等)转换为结构化的Markdown文档,适用于AI大模型和文本分析。该工具在GitHub上获得了超过58K的Star,提供了命令行和PythonAPI使用方式,并支持MarkdownConversionProtocol(MCP)。尽管在处理复杂格式时可能存在限制,但其多格式支持使其成为开发者的有力工具。
开源工具
文档处理
人工智能
文本分析
relext是一个强大的Python库,用于处理正则表达式相关任务
综合
relext是一个强大的Python库,用于处理正则表达式相关任务
2024-11-19 09:50:03 +0800 CST
view 1438
relext是一个强大的Python库,用于处理正则表达式相关任务。本文介绍了relext的安装、基本用法和高级用法,包括编译正则表达式、匹配字符串、搜索文本、分组、查找所有匹配项和使用预定义字符集等功能。通过实际案例,如提取邮箱地址和替换文本,展示了relext在文本解析和数据分析中的应用。
Python
编程
正则表达式
数据处理
文本解析
jieba是一个广受欢迎的Python库,专门用于中文文本的分词处理
综合
jieba是一个广受欢迎的Python库,专门用于中文文本的分词处理
2024-11-18 18:18:43 +0800 CST
view 1726
jieba是一个广受欢迎的Python库,专门用于中文文本的分词处理。它支持多种分词算法,允许用户添加自定义词典,并提供词性标注和关键词提取等高级功能。作为一个开源项目,jieba有着活跃的社区支持,用户可以轻松安装并使用它进行中文文本处理。
自然语言处理
文本分析
开源软件
awpa库是Python中处理文本数据的有用工具,提供分词、词性标注、实体识别等功能
综合
awpa库是Python中处理文本数据的有用工具,提供分词、词性标注、实体识别等功能
2024-11-18 13:58:00 +0800 CST
view 1381
awpa库是Python中处理文本数据的有用工具,提供分词、词性标注、实体识别等功能。本文介绍了awpa的安装、基本用法和高级用法,包括自定义词典和繁简转换,并提供了实际使用案例,展示如何高效处理中文文本。
Python库
文本分析
自然语言处理
diin-text库提供python文本预处理、词向量表示和句子相似度计算等功能
综合
diin-text库提供python文本预处理、词向量表示和句子相似度计算等功能
2024-11-18 20:34:05 +0800 CST
view 1740
本文介绍了Python中的diin-text库,涵盖了安装、基本用法、高级用法及实际案例。diin-text库提供文本预处理、词向量表示和句子相似度计算等功能,适合初学者和深度学习集成。通过示例代码,读者可以快速上手并应用于自然语言处理任务。
Python
自然语言处理
文本分析
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 317
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
编程
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
2026-06-12 17:21:39 +0800 CST
view 36
2026年6月Google发布DiffusionGemma,首个生产级文本扩散大模型,本地推理速度提升4倍。本文深入剖析其从自回归到并行生成的架构革命,附完整代码实战。
DiffusionGemma
文本扩散
本地AI
Gemma
大模型推理
扩散模型
Python
Ollama
DiffusionGemma 深度实战:当文本生成进入「扩散纪元」——从离散扩散原理到本地高速推理的完全指南(2026)
编程
DiffusionGemma 深度实战:当文本生成进入「扩散纪元」——从离散扩散原理到本地高速推理的完全指南(2026)
2026-06-14 01:18:58 +0800 CST
view 14
2026年6月Google开源DiffusionGemma——基于离散扩散技术的文本生成模型,打破传统自回归范式,实现4倍生成速度提升。本文深入解析其架构原理、性能实测、代码实战与生产落地。
DiffusionGemma
离散扩散
文本生成
AI大模型
Google
并行推理
MoE架构
MTools:免费开源的本地 AI 工具集,一个顶好几个
编程
MTools:免费开源的本地 AI 工具集,一个顶好几个
2026-05-13 17:55:20 +0800 CST
view 245
MTools是一款完全本地运行的开源AI工具集,集成抠图、证件照制作、人声分离、音频转文字、视频插帧、超分辨率等功能,保护隐私且不限次数使用。
AI工具
本地运行
开源软件
图像处理
音频处理
视频处理
人声分离
抠图工具
PHP 高效图像处理库 libvips:内存需求低到离谱,比 Imagick 快 4 倍!
编程
PHP 高效图像处理库 libvips:内存需求低到离谱,比 Imagick 快 4 倍!
2026-06-11 10:38:04 +0800 CST
view 52
php-vips是libvips的PHP绑定,比Imagick快约4倍,内存占用仅为后者的1/10。通过流式处理管线避免一次性加载整张图像,是处理大图和高并发图片服务的利器。
libvips
php-vips
PHP图像处理
图片处理
FFI
性能优化
缩略图
格式转换
lencode是一个用于处理Python中编码问题的强大库
综合
lencode是一个用于处理Python中编码问题的强大库
2024-11-18 08:44:06 +0800 CST
view 1445
lencode是一个用于处理Python中编码问题的强大库。本文介绍了lencode的安装、基本用法和高级用法,包括字符串和文件的编码转换、自定义编码器以及修复乱码的功能。通过示例代码,读者可以学习如何高效地处理中文数据和多语言文本的编码挑战。
Python库
编码处理
数据处理
Go 字符串与整数转换指南:Atoi 与 Itoa 的正确使用方式
编程
Go 字符串与整数转换指南:Atoi 与 Itoa 的正确使用方式
2025-08-26 06:32:41 +0800 CST
view 964
本文探讨了Go语言中字符串与整数之间的转换,重点介绍了`Atoi`和`Itoa`函数的使用方法、常见错误及最佳实践。通过示例代码,读者可以了解如何处理输入、验证数值范围以及提供友好的错误信息,从而编写更健壮的代码。
编程
Go语言
开发技巧
错误处理
字符串处理
lxml是一个功能强大且灵活的Python库,专为高效解析和操作XML/HTML文档而设计
综合
lxml是一个功能强大且灵活的Python库,专为高效解析和操作XML/HTML文档而设计
2024-11-18 21:30:07 +0800 CST
view 1630
lxml是一个功能强大且灵活的Python库,专为高效解析和操作XML/HTML文档而设计。它基于C语言编写的libxml2和libxslt库,支持XPath、XSLT、XMLSchema等高级功能。本文介绍了lxml的安装、特性、基本和高级功能,并提供了实际应用场景的示例代码,帮助开发者在项目中有效使用该库。
编程
数据处理
Python库
Web抓取
XML处理
Pathway 深度实战:55K Star 的 Python 实时 ETL 框架——从差分数据流原理到 RAG 管道生产部署的全链路架构解析
编程
Pathway 深度实战:55K Star 的 Python 实时 ETL 框架——从差分数据流原理到 RAG 管道生产部署的全链路架构解析
2026-05-07 06:38:15 +0800 CST
view 229
深度解析 Pathway 实时 ETL 框架:从差分数据流的数学原理到 Rust 引擎的工程实现,从实时交易风控管道到 RAG 向量索引的差分更新,全链路架构解析与生产部署实战
Pathway
ETL
流处理
Python
Rust
差分数据流
RAG
实时数据处理
增量计算
Pathway 深度解析:Python ETL 框架的流式处理革命 —— 用 Rust 引擎吊打 Flink/Spark,构建实时 LLM Pipeline
编程
Pathway 深度解析:Python ETL 框架的流式处理革命 —— 用 Rust 引擎吊打 Flink/Spark,构建实时 LLM Pipeline
2026-05-16 03:46:12 +0800 CST
view 253
55K+ Star,基于 Differential Dataflow 的 Rust 引擎,增量计算,内存计算,无缝集成 Python ML 生态——Pathway 正在重新定义实时流处理与 LLM Pipeline 的边界。
Python
流处理
实时分析
LLM
RAG
Pathway
ETL
开源项目
GitHub Trending
一个轻量级的JavaScript库,专为浏览器端高效图片压缩设计,支持JPEG、PNG、WEBP等格式
编程
一个轻量级的JavaScript库,专为浏览器端高效图片压缩设计,支持JPEG、PNG、WEBP等格式
2025-05-05 19:27:57 +0800 CST
view 1407
Compressor.js是一个轻量级的JavaScript库,专为浏览器端高效图片压缩设计,支持JPEG、PNG、WEBP等格式。它具备零依赖、纯前端处理和丰富的配置选项,适用于各种前端框架。通过简单的API,开发者可以在用户选择图片后进行压缩并上传,提升页面加载速度和用户体验,同时节省服务器带宽和存储空间。
Web开发
JavaScript
图片处理
性能优化
编程
Web 端 Office 文件预览工具库
2024-11-18 22:19:16 +0800 CST
view 2040
vue-office是一个支持多种文件预览的Vue插件工具库,能够处理Word、Excel、PDF等各类Office文件,兼容Vue2、Vue3及其他非Vue框架,支持在线地址和上传文件的预览。提供了安装和使用示例,支持多种文件格式的配置和事件监听功能。
前端
Vue
文件处理
插件
开源
JavaScript 格式化数字、金额、千分位、保留几位小数、四舍五入
编程
JavaScript 格式化数字、金额、千分位、保留几位小数、四舍五入
2024-11-19 09:32:08 +0800 CST
view 4078
本文介绍了几种在JavaScript中格式化数字和金额的方法,包括自定义函数formatCurrency、number_format和fmoney。每个函数都提供了参数说明和示例调用,展示了如何处理小数位、千分位和舍入方式。此外,还推荐了两个类库Numeral.js和accounting.js,用于更方便地格式化和操作数字。
JavaScript
数字处理
格式化
编程
开发
45+在线图片工具+REST API+AI修图:SnapOtter让NAS秒变个人图片处理中心
编程
45+在线图片工具+REST API+AI修图:SnapOtter让NAS秒变个人图片处理中心
2026-04-28 18:27:20 +0800 CST
view 485
基于Docker的自托管图片编辑器SnapOtter:45+工具、REST API接入AI Agent、本地AI修图(OCR/背景移除/高清化)、数据永久存NAS。海康智存部署教程。
Docker
NAS
图片处理
AI修图
本地部署
REST API
OpenClaw
Hermes
基于 Rust 开发的 Python 邮件验证库:emval
编程
基于 Rust 开发的 Python 邮件验证库:emval
2024-11-18 16:26:12 +0800 CST
view 1649
emval是一款基于Rust开发的Python邮件验证库,验证速度提升100-1000倍,支持国际化邮件地址,严格遵循RFC5322和RFC6531标准。提供易于理解的错误信息和丰富的功能,包括地址规范化和不安全Unicode字符拒绝。适用于处理大规模邮件数据,极大提升了Python邮件验证的性能与安全性。
编程
开发工具
邮件处理
性能优化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
9
下一页