我的pdf编码是一个奇怪的编码,我无法阅读。
这是我读取缓冲区时对象流的示例:
BT
1 0 0 -1 9670 5386 Tm
(.&RY!) Tj
610 0 Td
(.&R%!) Tj
570 0 Td
(.%R$!) Tj
-10310 -244 Td
(KSAK4UOH^.]SKHFS.@SKHF^S.H]) Tj
5954 0 Td
(!V) Tj
-961 0 Td
(!&#!%#%!!") Tj
1356 0 Td
(&!!) Tj
-2722 0 Td
(&.!!!!!'%W!$&&"b) Tj
ET
我尝试用pdftk和qpdf解压缩但是没有用。
它看起来像是加密的,但当我qpdf --show-encryption file.pdf
时,它会说:"文件未加密"。
当我使用pdftotext file.pdf output.txt
时,我可以完美地阅读输出文件,这样我就认为它必须是一个特殊的编码......
有什么建议吗?
答案 0 :(得分:1)