应用错误收集

反向工程二进制字典文件以提取字符串

时间：2012-05-25 10:10:43

标签： reverse-engineering

我有一个~600MB .DAT文件，其中包含一个意大利语词典（带有定义的重音词）。

我想从这个文件中提取所有字符串（只要我能阅读单词和定义，包含字符串和脏标题/二进制数据的原始转储就可以了。）

所以我的问题是： 是否有可以自动执行此操作的软件？

我会告诉它： '我知道这个文件包含字符串“TREE”，“DOG”，“CAT”，“COLLISION”......现在使用一些蛮力，统计分析或任何方法来尝试找出这些字符串是如何被编码的'

我想提及的两件事：

我是软件开发人员，但在逆向工程，十六进制编辑等方面完全没有经验或知识......
我不想花费数小时阅读逆向工程教程，并使用许多软件进行反复试验。如果我没有成功地以简单的方式提取我需要的东西，我将放弃这项任务。

我意识到很可能（如果文本是加密的）这个任务不能简单地执行，我只想尝试使用最好的工具。

1 个答案:

答案 0 :(得分：0)

似乎这样的自动化工具不存在，如果它存在，它只适用于一小组输入文件。

我终于找到了解决问题的方法。

我有一个EXE程序，允许浏览字典并显示单词的定义。

使用AutoHotkey，我写了一个相对简单的脚本，它搜索400k字输入列表中每个单词的定义，将其复制到剪贴板，然后将其粘贴到另一个输出文本文件中。

我必须在击键，窗口切换等之间插入一些Sleep语句，以使脚本稳定。预计整理字典的时间：20天：）