确定文件使用何种编码?

时间:2011-02-11 19:03:45

标签: encryption encoding

我有一个我认为是XML类型文件的文件,但是当我将扩展名更改为TXT并通过文本编辑器打开它时,我得到了

.�2�'��7cõ’¥¶_ä™πUUUN?¯ÖÀuóbåqW÷õxó_i}Ï08Y‚û¡d≈§•§è«/Óÿ`*∆cÅ·x…ëë«Öµ¶fi—

无论如何确定正在使用哪种编码?

编辑:

该文件是用于合法存款软件的ptx文件。我正在尝试为mac创建一个阅读器。

这是十六进制编辑器中文件的内容。



1 个答案:

答案 0 :(得分:1)

看起来不像普通的字符集。几乎所有编码都以某种形式保留ASCII字符。

所以我看到了一些可能性:

  1. 压缩文本/ xml文件中的文件
  2. 加密text / xml文件中的文件
  3. 这是一种二进制文件格式
  4. 它被混淆了
  5. 现在,如果我们看一下,我们会看到具有重复字符的序列,例如“UUU”和“ëë”经常发生。由于加密数据看起来完全随机,这使得第二种选择不太可能。

    是什么让你认为这应该是一个xml文件?由于文件是二进制文件,您可能希望以十六进制而不是文本的形式发布文件的开头。

    看看你的hex-dump我很确定它没有加密。像“01 00”这样的序列对于未压缩的二进制格式是典型的。所以这是我最好的猜测。


    仅从示例文件编写解析器相当困难。我要尝试的第一件事就是在网上寻找格式规范。

    如果您试图找出一种文件格式,您可以开始反转创建它们的应用程序(如果程序编译为汇编程序则相当困难,而且对于字节代码很容易,例如java或.net使用)。 / p>

    或者你从一个简单的文件开始。在程序中对其进行最小的更改,并比较文件中的差异。这是很多工作,只能用于相当简单的文件格式。


    搜索时找不到规格。似乎只有一个实现。你可以尝试联系创建它的公司,但我怀疑他们会帮助你。所以我想你需要自己对格式进行逆向工程。这可能并不容易,而且还有很多工作要做。好看。