python基于百度AI开发文字识别

时间:2023-03-09 07:24:54
python基于百度AI开发文字识别

很多场景都会用到文字识别,比如app或者网站里都会上传身份证等证件以及财务系统识别报销证件等等

第一步,你需要去百度AI里去注册一个账号,然后新建一个文字识别的应用 然后你将得到一个API Key 和Secret Key,如下图

百度AI地址 https://ai.baidu.com/tech/imagerecognition

百度AI文档 https://cloud.baidu.com/doc/OCR/s/zk3h7xz52

python基于百度AI开发文字识别

接下来,你需要安装百度ai的包

pip install baidu-aip

下载成功之后直接上代码,哈哈

# 基于百度AI开发的文字识别
# encoding:utf-8
import requests
import json
import base64 host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=新建应用得到的API Key&client_secret=新建应用得到的Secret Key'
response = requests.get(host)
if response:
request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"
f = open('./word.png', 'rb')
img = base64.b64encode(f.read())
params = {"image": img}
access_token = json.loads(response.text).get("access_token")
request_url = request_url + "?access_token=" + access_token
headers = {'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
if response:
print(response.json())

注意,open图片的地址我是直接放在和此py文件同一级目录下,结果如下

python基于百度AI开发文字识别

识别结果为

python基于百度AI开发文字识别

识别结果还是很准的,比pytesser3等识别的结果还是有保证些