Python好用的中文ocr库显示主要用法教程
Python中比较好用的中文OCR库有很多,以下介绍几个常用的库及其主要用法:
- Tesseract
Tesseract是一个开源的OCR库,可以识别多种语言,包括中文。使用前需要先安装,安装方法:pip install pytesseract。
主要用法:
import pytesseract
from PIL import Image
# 打开图片
img = Image.open('test.jpg')
# 转化为灰度图
img = img.convert('L')
# 识别图片
text = pytesseract.image_to_string(img, lang='chi_sim')
print(text)
- EasyOCR
EasyOCR是一个基于深度学习的OCR库,可以识别多种语言,包括中文。使用前需要先安装,安装方法:pip install easyocr。
主要用法:
import easyocr
# 创建OCR对象
reader = easyocr.Reader(['ch_sim', 'en'])
# 打开图片
img = 'test.jpg'
# 识别图片
result = reader.readtext(img)
# 输出结果
for r in result:
print(r[1])
- OCRopus
OCRopus是一个OCR系统,支持多种语言,包括中文。使用前需要先安装,安装方法:pip install ocropus。
主要用法:
import ocrolib
from ocrolib import edist, lstm
# 打开图片
img = ocrolib.read_image_binary('test.jpg')
# 识别图片
text = lstm.recognize_line_image(img)
print(text)
以上是几个常用的Python中文OCR库的主要用法,可以根据自己的需求选择使用。
原文地址: http://www.cveoy.top/t/topic/gje 著作权归作者所有。请勿转载和采集!