Ubuntu 系统安装 Tesseract-OCR：识别图像文字的利器

Tesseract-OCR 是一款强大的开源 OCR 引擎，可以将图像中的文本识别为可编辑文本。以下是在 Ubuntu 系统上安装 Tesseract-OCR 的步骤：

sudo apt-get update

sudo apt-get install tesseract-ocr tesseract-ocr-chi-sim

上述命令将安装英文和中文简体语言包。如果需要其他语言包，可以使用相应的包名称进行安装。

在终端中输入以下命令，检查 Tesseract-OCR 是否已经正确安装：

tesseract --version

如果已正确安装，将会显示 Tesseract-OCR 的版本号。

安装完成后，可以使用 Tesseract-OCR 进行 OCR 操作。例如，对于一个名为 'image.png' 的图像文件，可以在终端中输入以下命令：

tesseract image.png output.txt

此命令将在当前目录下生成一个名为 'output.txt' 的文件，其中包含了图像中的文本。