Question

最近我曾要求THIS QUESTION能够保存文件系统中PDF文件中的所有图像，并且我能够成功保存图像。

我在很多pdf文件上测试了我的代码，它运行得很好。但是，今天我来自THIS pdf file，从那里无法提取一些图像（附在下面）。

任何人都可以告诉我还有什么可以提取这些图像？甚至可以提取它们吗？它们真的是图像还是别的什么？我真的很感激帮助。

我的代码（请忽略硬编码，因为我仍然在测试它）：

function fn_getAllImages()
{
    var strPdf = "C:\\Users\\a614923\\Desktop\\haka\\Work\\2017\\10. October\\31\\test.PDF";
    var strout = "C:\\Users\\a614923\\Desktop\\haka\\Work\\2017\\10. October\\31\\Newfolder\\img"
    intPage = 2;          //for the 2nd page(the image is present in the 2nd page)
    var objPdf = JavaClasses.org_apache_pdfbox_pdmodel.PDDocument.load_3(strPdf);
    var objPage = objPdf.getDocumentCatalog().getAllPages().get(intPage-1);
    var objImages = objPage.getResources().getXObjects().values().toArray();
    var objImage, objImgBuffer, objImageFile;
    for(var i=0; i<objImages.length; i++)
    {
        objImage = objImages.items(i);
        Log.Message(objImage.toString());
        if(aqString.Find(objImage.toString(),"PDXObjectForm",0,false)>0)
        {
            continue;
        }
        else
        {
            objImage.write2file_2(strout+i);
            //objImgBuffer = objImage.getRGBImage();
            //objImageFile = JavaClasses.java_io.File.newInstance(strout+i+".png");
            //JavaClasses.javax_imageio.ImageIO.write(objImgBuffer,"png",objImageFile); 
        }
    }
}

我要保存的PDF文件中的图片（下面红框内的图片）：

从每页顶部提取某个图像时出现PDFBox_Facing问题

0 个答案: