使用AI技术的逆向工程文件格式

时间:2009-12-04 00:00:20

标签: artificial-intelligence cluster-analysis reverse-engineering file-format pattern-recognition

这是为了扩展问题:Tools to help reverse engineer binary file formats

是否有任何公开可用的工具使用群集和/或数据挖掘技术来反向工程文件格式?

例如,使用该工具,您将拥有一组具有相同格式的文件,并且该工具的输出将是通用结构?

1 个答案:

答案 0 :(得分:5)

如果有一个真正有效的二进制编码格式(ZIP文件就是一个例子),那么每个位的信息内容都很高。从本质上讲,它看起来像一个完美的随机数。

如果没有额外的知识,你无法从中推断出任何东西。

如果二进制编码效率不高,理论上你看到结构的机会微乎其微。但这仍然听起来很难;你怎么开始猜测田野的边界在哪里?

AI机器学习类型会告诉你,除非你已“几乎”知道它,否则你无法学到任何东西。他们通常会通过编码问题代码来解决问题,至少你可以解释这个问题。

我认为如果不提供更多信息,您就无法做到这一点。你对文件格式有什么了解吗?字段大小总是小于N位?只编码ASCII字符串,反之亦然?