我想使用pdfBox提取图像,并根据其宽度和高度及其位置提取图像周围的区域。对于某些文件(其中一些文件),提取的图像是上下颠倒的,对于这些文件,索引零似乎是左上角,而对于其他文件,索引零是左下角。所以我需要为这些图像定义一个不同的copbox :( 有人知道为什么会这样吗?为什么提取的图像颠倒了?为什么坐标原点发生变化? 我使用PDFBOX 2.0.11 这是存在此问题的文件的示例:
http://www.filedropper.com/test_58
这是我用于图像提取的代码的一部分
for (COSName name : pdResources.getXObjectNames()) {
PDXObject o = pdResources.getXObject(name);
if (o instanceof PDImageXObject) {
++objCount;
PDImageXObject image = (PDImageXObject)o;
String filename = OutPath+"/"+ file.getName()+"[Im]"+objCount +".tiff";
ImageIO.write(image.getImage(), "tiff", new File(filename));
ID.add(file.getName()+"[Im]"+objCount);
ImagePageNum.add(pagenum);
}
}
谢谢