PDFBOX提取倒置图像,为什么?

时间:2018-10-01 10:07:49

标签: pdfbox image-extraction

我想使用pdfBox提取图像,并根据其宽度和高度及其位置提取图像周围的区域。对于某些文件(其中一些文件),提取的图像是上下颠倒的,对于这些文件,索引零似乎是左上角,而对于其他文件,索引零是左下角。所以我需要为这些图像定义一个不同的copbox :( 有人知道为什么会这样吗?为什么提取的图像颠倒了?为什么坐标原点发生变化? 我使用PDFBOX 2.0.11 这是存在此问题的文件的示例:

http://www.filedropper.com/test_58

这是我用于图像提取的代码的一部分

 for (COSName name : pdResources.getXObjectNames()) {
                PDXObject o = pdResources.getXObject(name);
                if (o instanceof PDImageXObject) {
                    ++objCount;
                    PDImageXObject image = (PDImageXObject)o;
                    String filename = OutPath+"/"+ file.getName()+"[Im]"+objCount +".tiff";
                    ImageIO.write(image.getImage(), "tiff", new File(filename));
                    ID.add(file.getName()+"[Im]"+objCount);
                    ImagePageNum.add(pagenum);
                }

            }

谢谢

0 个答案:

没有答案