groovy pdfbox 读取的文本的时候 加入空格
我不太明白您的问题,但如果您是在使用Groovy和PDFBox来读取PDF文件并发现缺少空格,则可以尝试以下方法:
-
确保您使用的是最新版本的PDFBox库。
-
使用PDFTextStripper类而不是PDFTextStripperByArea类来提取文本。PDFTextStripper类将文本从左到右按顺序提取,并自动将空格插入适当的位置。
-
如果您仍然发现缺少空格,则可以尝试在提取文本之前设置PDFTextStripper的分隔符,如下所示:
def stripper = new PDFTextStripper()
stripper.setWordSeparator(" ") //设置分隔符为一个空格
String text = stripper.getText(document)
这将确保在提取文本时自动插入空格。
希望这可以帮助您解决问题。
原文地址: https://www.cveoy.top/t/topic/cSNA 著作权归作者所有。请勿转载和采集!