用于PDF到图像转换的开源库

时间:2011-03-29 10:44:22

标签: java itext file-conversion pdfbox jodconverter

  

可能重复:
  Export PDF pages to a series of images in Java

请建议一些好的java库,它们可用于PDF文件进行图像转换。 我尝试使用PDFBox:http://pdfbox.apache.org/但在转换为图像后,我的pdf文件中的大部分文本都出现乱码。它将'T'读作'Y','C'作为'#'等等。

以下是我用过的代码片段:

PDDocument document = null;  
document = PDDocument.load( pdfFile );  
List  pages = document.getDocumentCatalog().getAllPages();  
for( int i=startPage-1; i<endPage && i<pages.size(); i++ )  
{  
  try  
  {  
    PDPage page = (PDPage)pages.get( i );  
    BufferedImage  image = page.convertToImage();  
  }  
}  
document.close(); 

我想这是他们渲染字体的一些问题。 如果您认为我在使用PDFBox时可能遗漏了一些内容,请告诉我。

请同时建议其他任何替代方案。

我尝试过使用jPedal:http://www.jpedal.org/虽然效果很好但不是免费的,所以请在此建议所有好的选择。

1 个答案:

答案 0 :(得分:0)

尝试icePDF