python 实现简单的文字识别

近期学习python，无意中看到一个公众号上的文章，识别提取图片中的文字，实现方法是调用百度智能云平台提供的API接口，现记录下来，以备复习。百度智能云平台简介：百度智能云是百度提供的公有云平台，于2015年正式开放运营。百度云秉承“用科技力量推动社会创新”的愿景，不断将百度在云计算、大数据、人工智能的技术能力向社会输出。平台提供了各种人工智能应用的解决方案，为开发者提供了各种接口，使用者只要..

GY-赵

14383人浏览 · 2020-02-16 18:48:28

GY-赵 · 2020-02-16 18:48:28 发布

近期学习python，无意中看到一个公众号上的文章，识别提取图片中的文字，实现方法是调用百度智能云平台提供的API接口，现记录下来，以备复习。

百度智能云平台简介：百度智能云是百度提供的公有云平台，于2015年正式开放运营。百度云秉承“用科技力量推动社会创新”的愿景，不断将百度在云计算、大数据、人工智能的技术能力向社会输出。平台提供了各种人工智能应用的解决方案，为开发者提供了各种接口，使用者只要注册账号登录百度云平台，即可开通各种应用，除去特殊的一些接口外，大部分接口拥有免费使用次数，对于新手学习来说足够友好。
首先要注册百度云平台，在应用列表里创建应用，这里选择创建文字识别应用。
创建应用后，会有这样的界面，可以看到基本都是免费试用
这是有关文字识别的文档说明，在使用API时只要直接搜索文字识别，既可以看到这个页面
注册完成之后，要先看文档说明，根据文档说明下载现对应的SDK，配置相应的开发环境。如python，文档说的很清楚，只要按照文档进行就可以了

下面是有关代码：

from aip import AipOcr
""" 你的APPID AK SK """

APP_ID = '1xxxxxx'
API_KEY = 'xxxxx'
SECRET_KEY = 'xxxxx3'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

url="https://p4.img.cctvpic.com/photoAlbum/page/performance/img/2020/2/16/1581811174875_383.jpg"
#这里使用url网页图片，也可以使用本地图片，方法可以查看文档接口说明
options = {}

options["probability"] = "true"

Result=client.basicGeneralUrl(url,options)
print(Result["words_result_num"])
show=Result['words_result']
for i in show:
print(i['words'])
print(type(Result))
print(type(show))

输出结果：
1
武汉,把最坚硬的鱗都给你
<class ‘dict’>
<class ‘list’>
Press any key to continue . . .

可以看到函数返回的结果是一个字典，通过键值，可以读取输出对应的内容，这也与文档给出的示例一致。