Python 读取 PDF 文件内容：完整指南和代码示例

下面是一个使用 Python 的 PyPDF2 库来读取 PDF 文件内容的示例代码：

import PyPDF2

# 打开PDF文件
pdf_file = open('example.pdf', 'rb')

# 创建一个PDF阅读器对象
pdf_reader = PyPDF2.PdfFileReader(pdf_file)

# 获取PDF文件中的页数
num_pages = pdf_reader.getNumPages()

# 循环遍历每一页并读取文本内容
for page in range(num_pages):
    page_obj = pdf_reader.getPage(page)
    text = page_obj.extractText()
    print(text)

# 关闭PDF文件
pdf_file.close()

在这个示例中，我们首先打开一个名为'example.pdf'的 PDF 文件，然后创建一个 PdfFileReader 对象来读取文件内容。我们使用 getNumPages() 方法获取 PDF 文件中的页数，并使用 getPage() 方法遍历每一页，然后使用 extractText() 方法读取每一页的文本内容。最后，我们关闭打开的 PDF 文件。

请注意，要使用 PyPDF2 库，您需要先安装它。您可以使用 pip 来安装：

pip install PyPDF2

当然，还有其他的 Python 库可以用来读取 PDF 文件，例如 pdfminer、textract 等。使用这些库的方法略有不同，但一般都是通过创建一个 Reader 对象来读取 PDF 文件内容。