我正在尝试从pdf文件中提取一些照片。我遇到的最大问题是PDF文件中有一些图像,iTextSharp(版本5.5.9.0 )似乎不支持。
不支持色彩空间[/ Indexed,/ DeviceCMYK,13,109 0 R]。
我的问题是,如果itextsharp不支持使用上述颜色空间提取图像,那么有没有库可以做到?
www.extractpdf.com从这个pdf文件中获取我需要的一切(尽管由于安全原因,我无法提供相关的pdf文件。)
我会使用该网站但是我需要自动提取,替换一些颜色,并将图像放回到pdf中。这一部分我没有遇到任何问题,除了那些我无法提取,转换并放回到pdf中的图像。
我尝试使用字节数组提取相关图片,但无论文件扩展名是什么,似乎都无法打开文件。
var test = iTextSharp.text.pdf.PdfReader.GetStreamBytesRaw((iTextSharp.text.pdf.PRStream)PDFStremObj);
File.WriteAllBytes(@"C:\pdf images\test\test" + i + ".jpg", test);
" Mime"输入这些"损坏的图像"是application / octet-stream。还有其他具有相同mime类型的图像,似乎可以使用.png扩展名正确保存。
如果没有其他库支持这些类型的图像,那么我想我会回到这个pdf文件的创建者,看看他们是否可以转换pdf中的一些图像并重新保存。