python PaddleOCR库用法及知识点详解

编辑: admin 分类: python 发布时间: 2021-12-03 来源:互联网

说明

1、PaddleOCR是基于深度学习的ocr识别库，中文识别精度相当还不错，能够应对大多数文字提取需求。

2、需要依次安装三个依赖库，shapely库可能会受到系统的影响，出现安装错误。

安装命令

pip install paddlepaddle
pip install shapely
pip install paddleocr

代码实现

 ocr = PaddleOCR(use_angle_cls=True,)
# 输入待识别图片路径
img_path = r"d:\Desktop\4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png"
# 输出结果保存路径
result = ocr.ocr(img_path, cls=True)
    for line in result:
        print(line)
 
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores)
im_show = Image.fromarray(im_show)
im_show.show()

内容扩展：

简介

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

近期更新

2020.8.26 更新OCR相关的84个常见问题及解答，具体参考FAQ
2020.8.24 支持通过whl包安装使用PaddleOCR，具体参考Paddleocr Package使用说明
2020.8.21 更新8月18日B站直播课回放和PPT，课节2，易学易用的OCR工具大礼包，获取地址
2020.8.16 开源文本检测算法SAST和文本识别算法SRN
2020.7.23 发布7月21日B站直播课回放和PPT，课节1，PaddleOCR开源大礼包全面解读，获取地址
2020.7.15 添加基于EasyEdge和Paddle-Lite的移动端DEMO，支持iOS和Android系统

特性

超轻量级中文OCR模型，总模型仅8.6M
单模型支持中英文数字组合识别、竖排文本识别、长文本识别
检测模型DB（4.1M）+识别模型CRNN（4.5M）
实用通用中文OCR模型
多种预测推理部署方案，包括服务部署和端侧部署
多种文本检测训练算法，EAST、DB、SAST
多种文本识别训练算法，Rosetta、CRNN、STAR-Net、RARE、SRN
可运行于Linux、Windows、MacOS等多种系统

到此这篇关于python PaddleOCR库用法及知识点详解的文章就介绍到这了,更多相关python PaddleOCR库的介绍内容请搜索hwidc以前的文章或继续浏览下面的相关文章希望大家以后多多支持hwidc！

【原URL http://www.nextecloud.cn转载请说明出处】