最近我曾要求THIS QUESTION能够保存文件系统中PDF文件中的所有图像,并且我能够成功保存图像。
我在很多pdf文件上测试了我的代码,它运行得很好。但是,今天我来自THIS pdf file,从那里无法提取一些图像(附在下面)。
任何人都可以告诉我还有什么可以提取这些图像?甚至可以提取它们吗?它们真的是图像还是别的什么?我真的很感激帮助。
我的代码(请忽略硬编码,因为我仍然在测试它):
function fn_getAllImages()
{
var strPdf = "C:\\Users\\a614923\\Desktop\\haka\\Work\\2017\\10. October\\31\\test.PDF";
var strout = "C:\\Users\\a614923\\Desktop\\haka\\Work\\2017\\10. October\\31\\Newfolder\\img"
intPage = 2; //for the 2nd page(the image is present in the 2nd page)
var objPdf = JavaClasses.org_apache_pdfbox_pdmodel.PDDocument.load_3(strPdf);
var objPage = objPdf.getDocumentCatalog().getAllPages().get(intPage-1);
var objImages = objPage.getResources().getXObjects().values().toArray();
var objImage, objImgBuffer, objImageFile;
for(var i=0; i<objImages.length; i++)
{
objImage = objImages.items(i);
Log.Message(objImage.toString());
if(aqString.Find(objImage.toString(),"PDXObjectForm",0,false)>0)
{
continue;
}
else
{
objImage.write2file_2(strout+i);
//objImgBuffer = objImage.getRGBImage();
//objImageFile = JavaClasses.java_io.File.newInstance(strout+i+".png");
//JavaClasses.javax_imageio.ImageIO.write(objImgBuffer,"png",objImageFile);
}
}
}
我要保存的PDF文件中的图片(下面红框内的图片):