groovy pdfbox 复杂的文本格式读取的内容的时候 超出宽度 就插入空格设置指定宽度
可以使用PdfTextStripper类的setLineSeparator方法和setWordSeparator方法来设置行分隔符和单词分隔符。
例如,可以使用以下代码来设置行分隔符为换行符,单词分隔符为空格,并指定每行的宽度为500:
PdfTextStripper stripper = new PdfTextStripper();
stripper.setLineSeparator("\n");
stripper.setWordSeparator(" ");
stripper.setLineWidth(500);
String text = stripper.getText(document);
这样,在读取PDF文本时,当文本超出500个单位宽度时,文本将自动换行,并在单词之间插入空格。
原文地址: https://www.cveoy.top/t/topic/cSOh 著作权归作者所有。请勿转载和采集!