我正在使用 iText-4.2.0 https://github.com/ymasory/iText-4.2.0项目进行pdf页面内容提取。对于某些pdf文件,它可以正常工作。但是对于某些文件,只返回页面内容。
对此有何帮助?
代码:
//in constructor
fis = new FileInputStream(file);
reader = new PdfReader(fis);
pdfTextExtractor = new PdfTextExtractor(reader);
//in extractContent method
return pdfTextExtractor.getTextFromPage(pageNo);