解码从PDF文件中剥离的JPEG图像

时间:2015-05-29 04:50:29

标签: image jpeg huffman-code compression pdf-scraping

我有代码将jpgs解压缩成位图,这对JPEG文件很好用,但是当我输入一个JPEG时,我直接从PDF XObject剥离了我的错误。

Adob​​e阅读器显示图像正常,所以我不相信它已损坏。我已阅读JPEGPDFs文档,但未发现任何明显问题。

我的问题是,在PDF流和普通JPEG中嵌入的“JPEG”有什么不同吗?如果是这样的话是什么?

注意 :我可以手动打开PDF,复制图像,粘贴到绘画中,并保存...当我这样做时一切正常....我的问题是我需要这个自动化。

当我的代码解析PDF时,剥离图像流,将二进制文件转储到文件,然后我尝试打开这个文件,它不起作用。我错过了什么?

我的错误似乎发生在霍夫曼解码过程中,cdtHuffman表似乎被正确读取。

1 个答案:

答案 0 :(得分:0)

请原谅我使用答案部分,但我对评论部分感到满意​​:

我的问题: 1.什么代码无法解码JPEG?你说你“有代码”,但它来自哪里?为什么你认为它是可靠的?

  1. JPEG流的文件格式是什么? JFIF,ADOBE,EXIF,没有指定?
  2. 你的解码器无法处理文件格式吗?您的编码器是否检查不同类型的APPn标记?

    1. 什么是JPEG格式?什么类型的SOS标记?
    2. 此编码器源是否处理所有正常格式?基线,扩展,顺序,渐进?如果你有渐进式JPEG和编码器只做基线,你就会遇到问题。

      1. JPEG流有多少个组件?
      2. 某些Adobe文件有4个组件,解码器可能只能处理1个或3个。