CentOS7 中使用 Tesseract 和 OpenCV 将图像背景变为白色
要使用 tesseract 和 opencv 在 CentOS7 中将背景变成白色并保存为新图片,您可以按照以下步骤进行操作:
- 安装 tesseract 和 opencv
在 CentOS7 中安装 tesseract 和 opencv,您可以使用以下命令:
sudo yum install tesseract opencv
- 编写 Python 脚本
接下来,您需要编写一个 Python 脚本来处理图像。以下是一个示例脚本:
import cv2
import numpy as np
import pytesseract
# 读取图片
img = cv2.imread('input_image.png')
# 将图像转换为灰度
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 将图像转换为二值图像
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
# 去除噪声
kernel = np.ones((3,3), np.uint8)
opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=1)
# 执行 OCR
text = pytesseract.image_to_string(opening, lang='eng')
# 将背景变成白色
opening = cv2.bitwise_not(opening)
# 保存图片
cv2.imwrite('output_image.png', opening)
在这个脚本中,您首先读取输入图像,将其转换为灰度图像,然后将其转换为二值图像。接下来,您使用形态学操作去除图像中的噪声,并使用 tesseract 执行 OCR。最后,您将图像的背景变成白色,并将其保存为输出图像。
- 运行脚本
保存脚本并在终端中运行它:
python script.py
这将读取输入图像,处理它,将背景变成白色,并将输出图像保存为 output_image.png。
总结
在 CentOS7 中,使用 tesseract 和 opencv 将图像背景变成白色并保存为新图像是相对简单的。只需安装必要的软件包,编写一个 Python 脚本并运行它即可完成。
原文地址: https://www.cveoy.top/t/topic/oUx1 著作权归作者所有。请勿转载和采集!