python ocr识别图片中的文字

Python中有很多OCR库可以用来识别图片中的文字，常用的有Tesseract、OCRopus、CuneiForm等。这里以Tesseract为例介绍如何使用Python进行OCR识别。

安装Tesseract

Tesseract是一款开源的OCR引擎，可以在Windows、Linux、macOS等平台上运行。我们可以先到官网下载对应平台的安装包进行安装。

安装pytesseract

pytesseract是Tesseract的Python接口，可以方便地在Python中调用Tesseract进行OCR识别。我们可以使用pip安装pytesseract：

pip install pytesseract

识别图片中的文字

下面是一个简单的示例代码，使用pytesseract识别一张图片中的文字：

import pytesseract
from PIL import Image

# 读取图片
img = Image.open('test.png')

# 调用Tesseract进行OCR识别
text = pytesseract.image_to_string(img)

# 输出识别结果
print(text)

在这个示例中，我们使用Pillow库来读取图片，然后调用pytesseract的image_to_string方法进行OCR识别，最后将识别结果输出到控制台。

当然，pytesseract还提供了很多参数可以调整识别效果，比如语言选择、识别模式、配置文件等等。具体可以参考官方文档：https://pypi.org/project/pytesseract/