用python写一个读取PDF内容

下面是一个使用Python的PyPDF2库来读取PDF文件内容的示例代码：

import PyPDF2

# 打开PDF文件
pdf_file = open('example.pdf', 'rb')

# 创建一个PDF阅读器对象
pdf_reader = PyPDF2.PdfFileReader(pdf_file)

# 获取PDF文件中的页数
num_pages = pdf_reader.getNumPages()

# 循环遍历每一页并读取文本内容
for page in range(num_pages):
    page_obj = pdf_reader.getPage(page)
    text = page_obj.extractText()
    print(text)

# 关闭PDF文件
pdf_file.close()

在这个示例中，我们首先打开一个名为example.pdf的PDF文件，然后创建一个PdfFileReader对象来读取文件内容。我们使用getNumPages()方法获取PDF文件中的页数，并使用getPage()方法遍历每一页，然后使用extractText()方法读取每一页的文本内容。最后，我们关闭打开的PDF文件。

请注意，要使用PyPDF2库，您需要先安装它。您可以使用pip来安装：

pip install PyPDF2

当然，还有其他的Python库可以用来读取PDF文件，例如pdfminer、textract等。使用这些库的方法略有不同，但一般都是通过创建一个Reader对象来读取PDF文件内容