近期学习python,无意中看到一个公众号上的文章,识别提取图片中的文字,实现方法是调用百度智能云平台提供的API接口,现记录下来,以备复习。

百度智能云平台简介:百度智能云是百度提供的公有云平台,于2015年正式开放运营。百度云秉承“用科技力量推动社会创新”的愿景,不断将百度在云计算、大数据、人工智能的技术能力向社会输出。平台提供了各种人工智能应用的解决方案,为开发者提供了各种接口,使用者只要注册账号登录百度云平台,即可开通各种应用,除去特殊的一些接口外,大部分接口拥有免费使用次数,对于新手学习来说足够友好。
首先要注册百度云平台,在应用列表里创建应用,这里选择创建文字识别应用。
创建应用后,会有这样的界面,可以看到基本都是免费试用
这是有关文字识别的文档说明,在使用API时只要直接搜索文字识别,既可以看到这个页面
注册完成之后,要先看文档说明,根据文档说明下载现对应的SDK,配置相应的开发环境。如python,文档说的很清楚,只要按照文档进行就可以了


下面是有关代码:

from aip import AipOcr
""" 你的APPID AK SK """

APP_ID = '1xxxxxx'
API_KEY = 'xxxxx'
SECRET_KEY = 'xxxxx3'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

url="https://p4.img.cctvpic.com/photoAlbum/page/performance/img/2020/2/16/1581811174875_383.jpg"
#这里使用url网页图片,也可以使用本地图片,方法可以查看文档接口说明
options = {}

options["probability"] = "true"

Result=client.basicGeneralUrl(url,options)
print(Result["words_result_num"])
show=Result['words_result']
for i in show:
print(i['words'])
print(type(Result))
print(type(show))

输出结果:
1
武汉,把最坚硬的鱗都给你
<class ‘dict’>
<class ‘list’>
Press any key to continue . . .


可以看到函数返回的结果是一个字典,通过键值,可以读取输出对应的内容,这也与文档给出的示例一致。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐