Python3 图片识别文字

Python3可以使用OCR技术实现图片识别文字。OCR（Optical Character Recognition，光学字符识别）是一种将图像中的文字转换成可编辑和可搜索文本的技术。在Python3中，可以使用Tesseract OCR引擎实现图片文字识别。

以下是使用Python3和Tesseract OCR引擎实现图片文字识别的步骤：

安装Tesseract OCR引擎和Python3的tesseract包：

sudo apt-get install tesseract-ocr
pip3 install pytesseract

导入pytesseract包并读取图片：

import pytesseract
from PIL import Image

image = Image.open('image.jpg')

将图片转换成灰度图像：

gray_image = image.convert('L')

使用pytesseract包识别文字：

text = pytesseract.image_to_string(gray_image, lang='eng')
print(text)

完整代码示例：

import pytesseract
from PIL import Image

# 读取图片
image = Image.open('image.jpg')

# 将图片转换成灰度图像
gray_image = image.convert('L')

# 使用Tesseract OCR引擎识别文字
text = pytesseract.image_to_string(gray_image, lang='eng')

# 输出识别结果
print(text)

需要注意的是，图片识别文字的准确率受到多种因素影响，如图片质量、文字清晰度、文字大小等，因此需要根据实际情况进行调整和优化