前几天华为云OCR文字识别服务搞活动,新用户注册,1元体验1万次OCR识别服务(1年有效期),然后果断注册购买了。前提是,只能体验其中一种识别服务,经测试,我最终选择了“通用文字识别”,准确率贼高!
帮助文档:
https://support.huaweicloud.com/ocr/index.html
大致步骤:
- 申请服务
- 获取认证信息
- 获取文字识别SDK
- 文字识别服务SDK环境搭建
使用准备:
- 下载Python SDK(使用上面给的链接,进去下载即可)
- 下载自己的AK/SK密钥:登陆管理控制台 -> 鼠标移至用户名 -> 我的凭证 -> 管理访问密钥 -> 下载认证账户的AK/SK
- 通用文字识别服务接口(不同服务有不同的API接口): POST "/v1.0/ocr/general-text"
NOTE:使用OCR SDK(python)有2种方式:“AK/SK认证方式” 和 “Token认证方式”,不过个人建议用“AK/SK认证方式”,可以避免在代码中出现自己的用户名和密码(免得被别人看到,采用撞库的方式对自己造成损失)
简单的demo如下:

识别测试(本例采用了2行英文文字截图识别):
1. 测试图如下 (fig1.png):

2. 利用以上demo代码进行识别
3. 解析response结构
可以使用 "response.json()"将返回值转换为python的数据结构(字典和列表):

4. 字段含义:
- words_block_count对应了识别的文字行数
- words_block_list对应了识别位置,具体怎么看这个位置,还不清楚
- words则对应了识别出来的文字,可以看到,准确率还是非常高的!
评论 (0)