你可以使用 PdfTextStripper 类的 setWordSeparator(char) 方法来设置单词分隔符,例如空格。这样,当读取的内容超出指定宽度时,PdfBox 就会在合适的位置插入空格来分隔单词。

以下是一个示例代码:

PDDocument document = PDDocument.load(new File("example.pdf"));
PdfTextStripper stripper = new PdfTextStripper();
stripper.setWordSeparator(' '); // 设置单词分隔符为空格
String content = stripper.getText(document);
document.close();

System.out.println(content);

在上面的示例中,我们将 PdfTextStripper 的单词分隔符设置为空格,并使用 getText() 方法从 PDF 文件中提取文本内容。如果读取的内容超出指定宽度,PdfBox 就会在合适的位置插入空格来分隔单词。最后,我们将提取的文本内容打印到控制台上。

请注意,这种方法不一定能够完美地解决所有的文本换行问题。如果 PDF 文件中的文本格式非常复杂,可能需要使用更高级的方法来提取文本内容

groovy pdfbox 读取的内容的时候 超出宽度 就插入空格

原文地址: https://www.cveoy.top/t/topic/cSNZ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录