综合 Python 实现验证码识别：使用 Ddddocr 库

2024-11-18 18:38:02 +0800 CST views 1213

Python 实现验证码识别：使用 Ddddocr 库

前言

在自动化任务中，验证码识别是一项具有挑战性的任务。Ddddocr 是一个开源的 OCR 库，能帮助开发者处理各种验证码和图片中的文字识别。它基于 pytorch 和 onnxruntime，兼容性良好，能够处理中文、英文、数字以及特殊字符。

官方项目地址：ddddocr GitHub

安装方法

从 pypi 安装

可以通过 pip 安装 ddddocr 库：

pip install ddddocr

从源码安装

如果 pip 安装存在问题，可以从源码安装：

git clone https://github.com/sml2h3/ddddocr.git
cd ddddocr
python setup.py install

注意： 不要在ddddocr项目的根目录直接执行 import ddddocr，也不要将项目目录命名为 ddddocr，以避免模块冲突。

文件目录结构

项目基于 dddd_trainer 进行训练，使用 pytorch 作为训练框架，推理过程则依赖于 onnxruntime。

ddddocr
├── ddddocr/
│   ├── __init__.py
│   ├── common.onnx  # 新的OCR模型
│   ├── common_det.onnx  # 目标检测模型
│   ├── common_old.onnx  # 旧的OCR模型
├── README.md
├── setup.py

使用文档

基础 OCR 识别

ddddocr 主要用于识别图片中的文字，如验证码等。下面是一个简单的识别示例：

import ddddocr

# 初始化 OCR 对象
ocr = ddddocr.DdddOcr()

# 读取图片并进行OCR识别
image = open("example.jpg", "rb").read()
result = ocr.classification(image)
print(result)

使用第二套模型

如果需要切换到第二套OCR模型：

ocr = ddddocr.DdddOcr(beta=True)

image = open("example.jpg", "rb").read()
result = ocr.classification(image)
print(result)

支持透明图片的识别

对于黑色透明的 png 图片，可以使用 png_fix 参数：

result = ocr.classification(image, png_fix=True)

提示： 避免在每次OCR识别时都重新初始化 ddddocr，因为初始化后的第一次识别速度较慢。建议只初始化一次。

目标检测功能

除了OCR识别外，ddddocr 还能检测图像中的目标区域（返回目标的边界框 bbox），特别适合用来检测图像中的主体物体。示例：

import ddddocr
import cv2

# 初始化对象，启用目标检测
det = ddddocr.DdddOcr(det=True)

# 读取图片并进行目标检测
image = open("21.png", 'rb').read()
bboxes = det.detection(image)
print(bboxes)  # 输出目标区域的坐标

# 使用 OpenCV 绘制检测结果
im = cv2.imread("21.png")
for bbox in bboxes:
    x1, y1, x2, y2 = bbox
    im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)

# 保存结果图像
if im is not None and im.size != 0:
    cv2.imwrite("result.jpg", im)
else:
    print("Error: 处理后的图像是空的，无法保存。")

其他能力

ddddocr 还具备一些高级功能，比如：

滑块检测

ddddocr 提供了滑块检测功能，使用 opencv 实现，适用于处理滑块验证码的场景。

OCR 结果概率输出

ddddocr 支持返回识别结果的概率分布。通过 probability=True 参数，可以返回每个字符的识别概率：

result = ocr.classification(image, probability=True)

自定义 OCR 训练模型

开发者可以导入自定义训练的 OCR 模型，增强识别效果。

实际测试

可以从一些常见的验证码服务平台（如网易、腾讯的验证码服务）获取图片进行测试。ddddocr 在处理这类验证码时表现良好，能够成功识别大多数场景中的验证码内容。

总结

ddddocr 是一个功能强大且易于使用的 Python OCR 库，特别擅长处理验证码和单行文本的识别任务。它支持透明图片的处理、目标检测以及自定义模型导入。通过简单的初始化和调用，就能快速完成图片文字的识别和目标检测任务。

对于需要处理验证码或OCR识别的项目，ddddocr 无疑是一个理想的选择。

复制全文生成海报 Python OCR 图像处理机器学习开源

推荐文章

保护你的 Shell 脚本：Shell 脚本高效加密指南

2024-11-19 07:28:17 +0800 CST

Docker搭建一款功能强大、安全可控、易于部署和使用的企业级私有云存储解决方案

2024-11-18 20:33:38 +0800 CST

15 个你应该了解的有用 CSS 属性

2024-11-18 15:24:50 +0800 CST

2025-03-16 08:54:19 +0800 CST

在Vue3中实现代码分割和懒加载

2024-11-17 06:18:00 +0800 CST

在Vue 3中处理文件上传和下载功能

2024-11-18 22:35:15 +0800 CST

Vue3中的Slots有哪些变化？

2024-11-18 16:34:49 +0800 CST

手机导航效果

2024-11-19 07:53:16 +0800 CST

JSON.stringify()的陷阱及其隐藏的秘密

2024-11-19 08:53:06 +0800 CST

FastAPI 入门指南

2024-11-19 08:51:54 +0800 CST

Go语言中如何测试map中的键值对是否存在，以及如何删除元素

2024-11-18 09:17:03 +0800 CST

java MySQL如何获取唯一订单编号？

2024-11-18 18:51:44 +0800 CST

windown系统的vscode下的python环境搭建

2024-11-18 18:30:22 +0800 CST

Kivy是一个开源的Python库，用于开发跨平台的图形用户界面（GUI）

2024-11-18 17:52:00 +0800 CST

如何安全使用SSH？限制在本地访问

2024-11-19 03:35:41 +0800 CST

`tree` 是一个命令行工具，用于以树状结构显示目录内容

2024-11-19 05:38:41 +0800 CST

attrs是一个强大的Python库，旨在简化类定义，减少样板代码

2024-11-18 04:47:26 +0800 CST

Vue 中的单文件组件（Single File Components）是什么？如何使用它们？

2024-11-18 13:28:12 +0800 CST

Vue3 结合 Driver.js 实现新手指引

2024-11-18 19:30:14 +0800 CST

免费常用API接口分享

2024-11-19 09:25:07 +0800 CST

用 Electron + Vite + Vue3 搭建桌面端项目：Electron 基础配置

2024-11-19 08:49:45 +0800 CST

Python实现Zip文件的暴力破解

2024-11-19 03:48:35 +0800 CST

全新 Nginx 在线管理平台

2024-11-19 04:18:33 +0800 CST

探讨了JavaScript中Promise的设计哲学，解释了为何Promise不内置取消功能

2024-11-19 10:14:26 +0800 CST

正则数字、字母、字符密码组合校验

2024-11-19 02:29:35 +0800 CST

前端中的 File 和 Blob 两个对象到底有什么不同

2024-11-18 14:50:11 +0800 CST

Vue3中的状态管理：使用Pinia替代Vuex

2024-11-18 05:56:04 +0800 CST

如何在Vue3中使用音频库Howler.js实现音频播放？

2024-11-18 15:35:49 +0800 CST

Nginx 防止IP伪造，绕过IP限制

2025-01-15 09:44:42 +0800 CST

5种独特的图标导航设计，利用CSS和JavaScript提升用户体验

2024-11-19 10:04:42 +0800 CST

JavaScript 异步编程入门

2024-11-19 07:07:43 +0800 CST

liunx宝塔php7.3安装mongodb扩展

2024-11-17 11:56:14 +0800 CST

import 导入过的模块需要再次执行怎么办？

2024-11-18 11:04:52 +0800 CST

OwlAdmin是一个基于Vue3和Laravel的开源后台管理系统

2024-11-19 04:56:20 +0800 CST

5个高质量Vue3后台管理模板！开源免费，帮你快速搭建企业级中后台产品原型

2024-11-18 19:20:45 +0800 CST

Python 打造你的第一个网络监控工具

2024-11-18 16:18:08 +0800 CST

ftfy是一个强大的Python库，用于自动检测和修复文本中的编码问题

2024-11-18 23:40:21 +0800 CST

在Vue3中处理表单数据的方式是什么？与Vue2相比，是否有显著的变化或者新的建议？

2024-11-19 02:11:49 +0800 CST

Fighting Design：轻量级、强灵活！Vue 3 组件库中的隐藏宝藏

2024-11-18 14:29:42 +0800 CST

Go语言中`container/list`包的基本操作

2024-11-18 18:39:01 +0800 CST

vue-element-plus-admin是一个基于Vue3和Element-Plus的免费开源中后台模版，采用Vite和TypeScript，提供丰富的功能和组件，支持二次开发

2024-11-19 02:48:01 +0800 CST

纯CSS绘制iPhoneX的外观

2024-11-19 06:39:43 +0800 CST

JavaScript设计模式：桥接模式

2024-11-18 19:03:40 +0800 CST

Manus被越狱：提示词注入再现江湖

2025-03-10 19:37:20 +0800 CST

deepcopy一个Go语言的深拷贝工具库

2024-11-18 18:17:40 +0800 CST

rsync+inotify-tools liunx文件实时同步数据

2024-11-18 18:43:43 +0800 CST

用 Go 语言的 Fyne 库打造跨平台桌面应用程序

2024-11-17 18:55:51 +0800 CST

js正则验证人名，包含·（类似托儿.北科）

2024-11-19 05:56:23 +0800 CST

如何在Vue3中使用CompositionAPI构建一个响应式导航菜单？

2024-11-19 08:34:45 +0800 CST

#免密码登录服务器

2024-11-19 04:29:52 +0800 CST