我目前正在使用 python3 上的PDF图像提取。
我已经完成了核心逻辑并且工作得非常好。
问题是,有时YCCK编码的JPG文件来自PDF,对于普通的图像浏览者来说看起来很糟糕。
我可以将YCCK图像转换为CMYK,但我不知道如何确定图像是YCCK,CMYK还是YUV。
如果我将每个图像从YCCK转换为CMYK,它将破坏CMYK和YUV图像。
我搜索了几个小时,才发现this。
这篇文章有很多帮助,但我不能使用java API。
答案 0 :(得分:0)
为了确定使用的颜色空间,您必须解析流中的APPn块以确定文件格式:JFIF,SPIFF,EXIF,ADOBE等。如果您从PDF中获取它,文件可能是ADOBE格式。您需要查看他们如何使用APPn块的文档。
这是一个包含摘要的页面:
{{3}}