使用 Groovy 和 iTextPDF 读取 PDF 文件所有元素

以下是使用 Groovy 和 iTextPDF 库读取 PDF 所有元素的示例代码：

@Grab(group='com.itextpdf', module='itextpdf', version='5.5.13.2')
import com.itextpdf.text.pdf.PdfReader
import com.itextpdf.text.pdf.parser.PdfTextExtractor

def pdfReader = new PdfReader('path/to/pdf/file.pdf')
def numberOfPages = pdfReader.numberOfPages

for (i in 1..numberOfPages) {
    def pageText = PdfTextExtractor.getTextFromPage(pdfReader, i)
    println 'Page $i:'
    println pageText
}

pdfReader.close()

此代码将读取指定 PDF 文件的每个页面，并提取页面中的所有文本元素。如果您需要读取其他类型的元素，例如图像或表单字段，您可以使用 iTextPDF 库的其他类和方法来实现。