反向工程二进制字典文件以提取字符串

时间:2012-05-25 10:10:43

标签: reverse-engineering

我有一个~600MB .DAT文件,其中包含一个意大利语词典(带有定义的重音词)。

我想从这个文件中提取所有字符串(只要我能阅读单词和定义,包含字符串和脏标题/二进制数据的原始转储就可以了。)

所以我的问题是: 是否有可以自动执行此操作的软件?

我会告诉它: '我知道这个文件包含字符串“TREE”,“DOG”,“CAT”,“COLLISION”......现在使用一些蛮力,统计分析或任何方法来尝试找出这些字符串是如何被编码的'

我想提及的两件事:

  • 我是软件开发人员,但在逆向工程,十六进制编辑等方面完全没有经验或知识......
  • 我不想花费数小时阅读逆向工程教程,并使用许多软件进行反复试验。如果我没有成功地以简单的方式提取我需要的东西,我将放弃这项任务。

我意识到很可能(如果文本是加密的)这个任务不能简单地执行,我只想尝试使用最好的工具。

1 个答案:

答案 0 :(得分:0)

似乎这样的自动化工具不存在,如果它存在,它只适用于一小组输入文件。

我终于找到了解决问题的方法。

我有一个EXE程序,允许浏览字典并显示单词的定义。

使用AutoHotkey,我写了一个相对简单的脚本,它搜索400k字输入列表中每个单词的定义,将其复制到剪贴板,然后将其粘贴到另一个输出文本文件中。

我必须在击键,窗口切换等之间插入一些Sleep语句,以使脚本稳定。 预计整理字典的时间:20天:)