欢迎小伙伴的点评✨✨,相互学习、互关必回、全天在线🍳🍳🍳


前言

本文将给大家浅浅介绍一下使用python从图片获得文字的思路


开发环境介绍需要安装以下3个应用

  • python-3.10.5-amd64.exe(目前官网最新版本)
  • tesseract-ocr-w64-setup-v5.2.0.20220712.exe(使用tesseract-ocr获得图片上的文字信息)
  • pycharm-community-2022.1.4.exe(目前官网最新版)

1、 python-3.10.5-amd64.exe 下载及安装图解

python官网链接
图一

在这里插入图片描述
下载好后、安装时记得添加路径
图二
在这里插入图片描述

运行完后、可打开cmd命令窗口进行验证 输入命令python即可
图三

在这里插入图片描述
cmd显示如上图所示,表示python 安装完成

2、tesseract-ocr-w64-setup-v5.2.0.20220712.exe下载及安装

2.1、已知下载方法有两种

1、githuab 下载直接使用 命令拉取即可

git  clone  https://github.com/dhn111/Python.git

2、网站下载选择适合自己的版本即可

tesseract-ocr网站下载链接

2.2、tesseract-ocr安装环境设置图解

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
此时路径需要注意一下,安装完成后需要把路径拷贝到系统path中

在这里插入图片描述

2.2.1环境设置

在这里插入图片描述
路径拷贝到系统path中
在这里插入图片描述
在这里插入图片描述
确定即可

3 、pycharm-community-2022.1.4.exe 下载及安装

3.1 官网下载

pycharm-community下载链接(点我)

3.2安装图解

在这里插入图片描述
注意这里全部打勾

在这里插入图片描述
在这里插入图片描述
新建项目这里会自动设置路径环境

在这里插入图片描述
新建完成后,会出现main文件直接run main 即可验证环境装好没
在这里插入图片描述
若打印 如图信息 即环境设置成功

4、 源码详解

import pytesseract
from PIL import Image
# 读取图片信息
im = Image.open('123.jpg')
# 把从图片识别的文字传给变量,打印到控制台
string = pytesseract.image_to_string(im)
print(string)

直接把源码拷贝到项目main中 如下图

在这里插入图片描述
此时 编译器应该会有报错提醒 说没有找到 pytesseract 、所以我们直接通过cmd 终端 下载pytesseract 模块即可 我使用的是PyCharm 里面的终端和cmd 是一样的道理 。如下图

在这里插入图片描述
命令如下

pip install pytesseract
pip install pillow

安装完成后 我们仍然需要在PyCharm 手动安装一下。如下图

在这里插入图片描述
安装后 编译器 应该就不会报错了, 我使用的图片如下图 拷贝到编译器的路径

在这里插入图片描述
在这里插入图片描述
然后就可以愉快的编译了 直接run main 效果图 如下

在这里插入图片描述

5、总结

python 实现图片识别文字的关键在于使用tesseract-ocr工具 我们通过tesseract-ocr获取到文字 在输出到控制台上

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐