从每页顶部提取某个图像时出现PDFBox_Facing问题

时间:2017-11-02 11:04:43

标签: pdf pdfbox

最近我曾要求THIS QUESTION能够保存文件系统中PDF文件中的所有图像,并且我能够成功保存图像。

我在很多pdf文件上测试了我的代码,它运行得很好。但是,今天我来自THIS pdf file,从那里无法提取一些图像(附在下面)。

任何人都可以告诉我还有什么可以提取这些图像?甚至可以提取它们吗?它们真的是图像还是别的什么?我真的很感激帮助。

我的代码(请忽略硬编码,因为我仍然在测试它)

function fn_getAllImages()
{
    var strPdf = "C:\\Users\\a614923\\Desktop\\haka\\Work\\2017\\10. October\\31\\test.PDF";
    var strout = "C:\\Users\\a614923\\Desktop\\haka\\Work\\2017\\10. October\\31\\Newfolder\\img"
    intPage = 2;          //for the 2nd page(the image is present in the 2nd page)
    var objPdf = JavaClasses.org_apache_pdfbox_pdmodel.PDDocument.load_3(strPdf);
    var objPage = objPdf.getDocumentCatalog().getAllPages().get(intPage-1);
    var objImages = objPage.getResources().getXObjects().values().toArray();
    var objImage, objImgBuffer, objImageFile;
    for(var i=0; i<objImages.length; i++)
    {
        objImage = objImages.items(i);
        Log.Message(objImage.toString());
        if(aqString.Find(objImage.toString(),"PDXObjectForm",0,false)>0)
        {
            continue;
        }
        else
        {
            objImage.write2file_2(strout+i);
            //objImgBuffer = objImage.getRGBImage();
            //objImageFile = JavaClasses.java_io.File.newInstance(strout+i+".png");
            //JavaClasses.javax_imageio.ImageIO.write(objImgBuffer,"png",objImageFile); 
        }
    }
}

我要保存的PDF文件中的图片(下面红框内的图片):

enter image description here

0 个答案:

没有答案