可以使用PdfTextStripper类的setLineSeparator方法和setWordSeparator方法来设置行分隔符和单词分隔符。

例如,可以使用以下代码来设置行分隔符为换行符,单词分隔符为空格,并指定每行的宽度为500:

PdfTextStripper stripper = new PdfTextStripper();
stripper.setLineSeparator("\n");
stripper.setWordSeparator(" ");
stripper.setLineWidth(500);
String text = stripper.getText(document);

这样,在读取PDF文本时,当文本超出500个单位宽度时,文本将自动换行,并在单词之间插入空格。

groovy pdfbox 复杂的文本格式读取的内容的时候 超出宽度 就插入空格设置指定宽度

原文地址: https://www.cveoy.top/t/topic/cSOh 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录