Python怎么使用EasyOCR工具识别图像文本

编辑: admin 分类: python 发布时间: 2023-05-01 来源:互联网

什么是 EasyOCR ?

描述: EasyOCR 是一个用于从图像中提取文本的 python 模块, 它是一种通用的 OCR,既可以读取自然场景文本,也可以读取文档中的密集文本。目前支持 80 多种语言和所有流行的书写脚本,包括:拉丁文、中文、阿拉伯文、梵文、西里尔文等。

EasyOCR 是 PyTorch 实现的一个光学字符识别 (OCR) 工具。

Q: 使用 EasyOCR 可以干什么?

描述: EasyOCR 支持两种方式运行一种是常用的CPU,而另外一种是需要GPU支持并且需安装CUDA环境, 我们使用其可以进行图片中语言文字识别, 例如小程序里图片识别、车辆车牌识别(即车债管理系统)。

安装 EasyOCR

在命令窗口中,使用 pip 安装 EasyOCR 稳定版本。

pip install easyocr
登录后复制

使用 EasyOCR

import easyocr

reader = easyocr.Reader(
    ['ch_sim', 'en'],
    gpu=False,
    model_storage_directory='model/.',
    user_network_directory='model/.',
)
result = reader.readtext('examples/chinese.jpg')
登录后复制

执行上面的代码时,会自动通过网络下载检测与识别模型到指定目录下。

  • ['ch_sim', 'en'],: 指定识别的语言

  • gpu=False,: 设置是否使用GPU (EasyOCR在GPU上运行效率更高, 没有GPU或者GPU内存不足时设置False)

  • model_storage_directory='model/.',: 检测与识别模型的存储路径 (没有设置时默认存储在~/.EasyOCR/model目录)

识别结果 result 是一个列表,列表中的每一项都是一个长度为 3 的识别结果,例如 ([[189, 75], [469, 75], [469, 165], [189, 165]], '愚园路', 0.3754989504814148),它们分别是 边界框检测到的文本置信度 值。

easyocr-server

EasyOCR 服务器是一个用于从图像中提取文本。它是一种通用的 OCR,既可以读取自然场景文本,也可以读取文档中的密集文本。目前支持 80+ 种语言,并且还在扩展。

安装步骤

步骤 0. 从 GitHub 下载 easyocr-server 并安装。

git clone https://github.com/hekaiyou/easyocr-server.git
登录后复制

步骤 1. 使用 PyPI 安装 easyocr、 bottle 和 gevent 模块。

cd easyocr-server
pip install -r requirements.txt
登录后复制

验证安装

python main.py
登录后复制
  • Browser: http://localhost:8080/ocr/

  • CMD: curl http://localhost:8080/ocr/ -F "language=en" -F "img_file=@examples/english.png"

验证成功后,您应该能够在浏览器中看到打印的推理结果。

Python怎么使用EasyOCR工具识别图像文本

通过 Docker 部署服务

我们提供了一个 Dockerfile 来构建镜像。

docker build -t easyocr-server:latest .
登录后复制

运行它。

docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
登录后复制LanguageCode NameAbazaabqAdygheadyAfrikaansafAngikaangArabicarAssameseasAvaravaAzerbaijaniazBelarusianbeBulgarianbgBiharibhBhojpuribhoBengalibnBosnianbsSimplified Chinesech_simTraditional Chinesech_traChechencheCzechcsWelshcyDanishdaDargwadarGermandeEnglishenSpanishesEstonianetPersian (Farsi)faFrenchfrIrishgaGoan KonkanigomHindihiCroatianhrHungarianhuIndonesianidIngushinhIcelandicisItalianitJapanesejaKabardiankbdKannadaknKoreankoKurdishkuLatinlaLaklbeLezghianlezLithuanianltLatvianlvMagahimahMaithilimaiMaorimiMongolianmnMarathimrMalaymsMaltesemtNepalineNewarinewDutchnlNorwegiannoOccitanocPalipiPolishplPortugueseptRomanianroRussianruSerbian (cyrillic)rs_cyrillicSerbian (latin)rs_latinNagpurisckSlovakskSlovenianslAlbaniansqSwedishsvSwahiliswTamiltaTabassarantabTeluguteThaithTajiktjkTagalogtlTurkishtrUyghurugUkranianukUrduurUzbekuzVietnamesevi

以上就是Python怎么使用EasyOCR工具识别图像文本的详细内容,更多请关注海外IDC网其它相关文章!

【本文转自:防御ddos http://www.558idc.com/stgf.html提供,感谢支持】