PDFBox convertToImage无法正确呈现某些PDF

时间:2013-12-31 19:25:38

标签: java pdf pdfbox

我正在使用PDFBox的PDPage.convertToImage()方法将已加载的PDF文件的页面转换为图像。它适用于某些PDF但是它给了我很多文件的控制台错误,然后在屏幕上无法正确呈现 - 图像和文本都丢失了。

Dec 31, 2013 7:15:34 PM org.apache.pdfbox.util.PDFStreamEngine processOperator
INFO: unsupported/disabled operation: EI
Dec 31, 2013 7:15:34 PM org.apache.pdfbox.pdmodel.font.PDTrueTypeFont getawtFont
INFO: Using font SansSerif.plain instead

Dec 31, 2013 7:02:15 PM org.apache.pdfbox.util.PDFStreamEngine processOperator
INFO: unsupported/disabled operation: i

只需使用以下命令完成文件加载:

PDDocument pdfDoc = PDDocument.load(file);
List<PDPage> pages = pdfDoc.getContent().getDocumentCatalog().getAllPages();
PDPage page = pages.get(pageNo);
page.convertToImage();

我尝试使用loadNonSeq()而不是load(),但这没有帮助。我是否应该使用PDFStreamEngine来处理这些PDF?我不确定读者是否真的无法呈现这些或者功能是否需要以某种方式启用。

2 个答案:

答案 0 :(得分:0)

我之前回复的帖子解决了您的问题,使用PDFRender jar就可以了。

How to increase the resolution of image in PDF renderer?

发布的问题仅转换PDF的第一页,答案将PDF的所有页面转换为图像格式。

答案 1 :(得分:0)

从这里http://mvnrepository.com/artifact/org.apache.pdfbox/fontbox/1.8.5

尝试fontbox jar

或使用maven存储库..