Tesseract-OCR 是一款强大的开源 OCR 引擎,可以将图像中的文本识别为可编辑文本。以下是在 Ubuntu 系统上安装 Tesseract-OCR 的步骤:

  1. 打开终端并更新软件包列表:
sudo apt-get update
  1. 安装 Tesseract-OCR 和语言包:
sudo apt-get install tesseract-ocr tesseract-ocr-chi-sim

上述命令将安装英文和中文简体语言包。如果需要其他语言包,可以使用相应的包名称进行安装。

  1. 验证安装:

在终端中输入以下命令,检查 Tesseract-OCR 是否已经正确安装:

tesseract --version

如果已正确安装,将会显示 Tesseract-OCR 的版本号。

安装完成后,可以使用 Tesseract-OCR 进行 OCR 操作。例如,对于一个名为 'image.png' 的图像文件,可以在终端中输入以下命令:

tesseract image.png output.txt

此命令将在当前目录下生成一个名为 'output.txt' 的文件,其中包含了图像中的文本。

Ubuntu 系统安装 Tesseract-OCR:识别图像文字的利器

原文地址: https://www.cveoy.top/t/topic/ms7g 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录