public class Pdf2Image {
private Image image;
int length;
public int convertPdf2Image(String pdfname) {
File file = new File(pdfname);
RandomAccessFile raf;
try {
raf = new RandomAccessFile(file, "r");
FileChannel channel = raf.getChannel();
ByteBuffer buf = channel.map(FileChannel.MapMode.READ_ONLY, 0, channel.size());
PDFFile pdffile = new PDFFile(buf);
// draw the first page to an image
int num = pdffile.getNumPages();
length=num;
for (int i = 0; i <= num; i++) {
PDFPage page = pdffile.getPage(i);
//get the width and height for the doc at the default zoom
int width = (int) page.getBBox().getWidth();
int height = (int) page.getBBox().getHeight();
Rectangle rect = new Rectangle(0, 0, width, height);
int rotation = page.getRotation();
Rectangle rect1 = rect;
if (rotation == 90 || rotation == 270) {
rect1 = new Rectangle(0, 0, rect.height, rect.width);
}
//generate the image
BufferedImage img = (BufferedImage) page.getImage(
rect.width, rect.height, //width & height
rect1, // clip rect
null, // null for the ImageObserver
true, // fill background with white
true // block until drawing is done
);
ImageIO.write(img, "png", new File("src\\downloadedFiles\\aa" + i + ".png"));
}
} catch (FileNotFoundException e1) {
System.err.println(e1.getLocalizedMessage());
} catch (IOException e) {
System.err.println(e.getLocalizedMessage());
}
return length;
}
public static void main(String[] args) {
Pdf2Image p = new Pdf2Image();
p.convertPdf2Image("src\\downloadedFiles\\todaypdf.pdf");
}
}
我正在使用此代码将PDF文件转换为图像。它适用于大多数PDF,但显示PDF文件的例外情况。例外是:
Expected 'xref' at start of table.
任何人都可以告诉我为什么会给出这样的例外吗?
答案 0 :(得分:3)
野外存在许多格式错误的PDF文件,这很可能就是其中之一。
在看到问题PDF文件之前,无法给出明确的答案。我猜测的是'startxref'指定PDF应该位于PDF的绝对位置。 java库跳转到文件上的这个位置,希望找到单词'xref'但找不到它。
http://blog.amyuni.com/?p=1627
解决此问题的一种方法是将文件加载到完整版Acrobat中,然后保存文件。 Acrobat将修复链接中提到的外部参照偏移。
有相当大的公司会产生格式错误的PDF,应该知道更好。 Adobe允许这些文件存在,因为它使他们的PDF竞争对手难以跟上并竞争。