EasyOCR是一个OCR三方库,可以方便地使用Python进行文字识别。
在这里插入设备图片描述

1 安装

在命令提示符中,使用 pip 安装 EasyOCR 稳定版本

pip install easyocr

在这里插入图片描述
进入GitHub地址https://github.com/JaidedAI/EasyOCR,下载目标文件
在这里插入图片描述
在命令提示符中使用cd命令进入目标文件夹地址,在使用 Python setup.py install 命令进行预安装
在这里插入图片描述
完成安装的样子
在这里插入图片描述
随后使用pip命令对所需要的库进行安装

torch
torchvision>=0.5
opencv-python
scipy
numpy
Pillow
scikit-image
python-bidi
PyYAML

例如

pip install torch

2 使用方法


对该图片进行文字识别

import easyocr
reader = easyocr.Reader(['ch_sim','en']) # 只需要运行一次就可以将模型加载到内存中
result = reader.readtext('chinese.jpg')

输出将采用列表格式,每个项目分别表示边界框,文本和置信度。

#result 如下所示
[([[189, 75], [469, 75], [469, 165], [189, 165]], '愚园路', 0.3754989504814148),
 ([[86, 80], [134, 80], [134, 128], [86, 128]], '西', 0.40452659130096436),
 ([[517, 81], [565, 81], [565, 123], [517, 123]], '东', 0.9989598989486694),
 ([[78, 126], [136, 126], [136, 156], [78, 156]], '315', 0.8125889301300049),
 ([[514, 126], [574, 126], [574, 156], [514, 156]], '309', 0.4971577227115631),
 ([[226, 170], [414, 170], [414, 220], [226, 220]], 'Yuyuan Rd.', 0.8261902332305908),
 ([[79, 173], [125, 173], [125, 213], [79, 213]], 'W', 0.9848111271858215),
 ([[529, 173], [569, 173], [569, 213], [529, 213]], 'E', 0.8405593633651733)]

注1:[‘ch_sim’,‘en’]是您要阅读的语言列表。 您可以一次传递几种语言,但并非所有语言都可以一起使用。 英语与每种语言都兼容。 共享公共字符的语言通常相互兼容。

注2:您也可以将OpenCV图像对象(numpy数组)或图像文件作为字节传递,而不是filepath chinese.jpg。 原始图片的网址也是可以接受的。

注3:行reader = easyocr.Reader([‘ch_sim’,‘en’])用于将模型加载到内存中。 这需要一些时间,但只需要运行一次。

您还可以将detail设置为0,以简化输出。

reader.readtext('chinese.jpg', detail = 0)

Result:

['愚园路', '西', '东', '315', '309', 'Yuyuan Rd.', 'W', 'E']

如果您没有GPU或GPU的内存不足,则可以通过添加gpu = False在CPU模式下运行它

reader = easyocr.Reader(['ch_sim''en'],gpu = False
Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐