这种乱码是什么样的编码

时间:2017-03-31 00:01:31

标签: pdf text encoding

我下载的这个文件应该是PDF(我想,我可能只是一个文本文件),但请看下面的图片,看看文件的样子。有谁知道这是什么,或者它是否可以转换?

enter image description here

1 个答案:

答案 0 :(得分:0)

如果它来自PDF文件,则很可能是Flate编码(与zip文件一样使用相同类型的压缩,但不能打开带有zip实用程序的PDF文件)。对于非图像数据,这是PDF中最常见的压缩。它不是ASCIIHex或ASCII85编码的。它可能但不可能是LZW或RunLength(RLE)编码的。如果是图像数据,则可以是CITTFax,JBIG2,DCT(基本上是JPEG)或JPX(JPEG 2000)编码。

在某些情况下,PDF的某些部分可能会被多个这些过滤器编码,因此可以使用DCT和ASCII85的组合。但这不再常见了。

或者PDF文件可以加密,在这种情况下,您可以选择RC4或不同风格的AES加密。使用自定义加密也是可能的(例如,如果PDF文件是电子书)。

您提供的屏幕截图并不包含足够的信息来确定文件特定部分的情况,但最终结论是您需要使用了解PDF格式的软件阅读PDF文件;文本编辑不会做。