我有一个.pdf文件集合,当使用pdf-parser.py时,它给出: FlateDecode解压缩失败。 zlib.error解压缩时发生错误-3:标头检查不正确。见下面。
PDF Comment %PDF-1.4
PDF Comment %âãÏÓ
obj 1 0
Type: /ExtGState
Referencing:
<<
/Type/ExtGState
/SA false
/SM 0.02
>>
<<
/Type /ExtGState
/SA false
/SM 0.02
>>
<<
/Type/ExtGState
/SA false
/SM 0.02
>>
obj 2 0
Type:
Referencing:
[/DeviceRGB]
[/DeviceRGB]
obj 3 0
Type:
Referencing:
Contains stream
<<
/Filter /FlateDecode
/Length 1136
>>
FlateDecode decompress failed. zlib.error Error -3 while decompressing: incorrect header check
...
...
<<
/Producer (tx_pdf 15.0.130.501)
/CreationDate (D:20100309081052Z)
>>
ZLIB标头(在RFC1950中定义)应为:
CMF | FLG
0x78 | 0x01 - No Compression/low
0x78 | 0x9C - Default Compression
0x78 | 0xDA - Best Compression
在010编辑器中检查文件时,标头字节为0x78和0xC3。查看图片:
有人知道字节可能代表哪种压缩吗?我试图用Google搜索生产者(/ Producer(tx_pdf 15.0.130.501)),但没有结果。