我正在尝试使用PDF小丑库(一个Java库)提取PDF文件。基本上我正在做的是使代码突出显示特定的字符串,如果它在文本中。但主要问题是提取PDFpdf文件。
Map<Rectangle2D,List<ITextString>> textString = textExtractor.extract(page);
正在发生的事情是,这段代码在所有情况下都运行良好,例如,不同的字体,不同的字体大小,除非PDF文件中有子弹,任何类型的子弹甚至编号(i,ii,iii) )子弹给出错误:
Exception in thread "main" java.lang.ExceptioninIntializerError
然后在内置的pdfclown库文件中还有一些其他错误,我不知道,但后来写了一个例外:
caused by: java.lang.NullpointerException