python ocr识别图片中的文字,并存入excel表格中的指定单元格内
为了实现这个任务,我们需要使用Python中的一些库,包括:
Pillow用于打开和处理图像pytesseract用于OCR识别openpyxl用于处理Excel文件
首先,我们需要安装这些库。在终端中输入以下命令:
pip install Pillow
pip install pytesseract
pip install openpyxl
接下来,我们可以使用以下代码来实现OCR识别并将结果存储到Excel表格中的指定单元格中:
import pytesseract
from PIL import Image
from openpyxl import Workbook
# 打开图像文件
img = Image.open('image.png')
# 识别图像中的文字
text = pytesseract.image_to_string(img)
# 创建一个新的Excel工作簿
wb = Workbook()
# 获取活动工作表
ws = wb.active
# 将OCR识别结果写入指定单元格
ws['A1'] = text
# 保存Excel文件
wb.save('result.xlsx')
在这个例子中,我们将OCR识别结果写入Excel表格的A1单元格中。你可以根据需要修改单元格位置。如果你想在不覆盖现有数据的情况下追加结果,可以使用以下代码:
# 打开Excel文件
wb = load_workbook('result.xlsx')
# 获取活动工作表
ws = wb.active
# 在最后一个非空行之后追加OCR识别结果
row = ws.max_row + 1
ws.cell(row=row, column=1, value=text)
# 保存Excel文件
wb.save('result.xlsx')
请注意,这需要在代码中导入load_workbook函数:
from openpyxl import load_workbook
原文地址: https://www.cveoy.top/t/topic/vPo 著作权归作者所有。请勿转载和采集!