读取专有文件类型

时间:2010-08-19 20:41:02

标签: open-source reverse-engineering file-format

如何在没有该专有软件的情况下开发软件来读取专有文件类型。像开放式办公室人员用MS Word(.doc)文件做的事情。 Open Office可以读取.doc文件。

如果专有软件有一个开源SDK,这可能很容易,例如Adobe有Flex开源SDK,因此可以在没有Adobe Flash的情况下创建flash(.swf)文件。但对于MS Word,我相信没有开源SDK,开放式办公室的人如何让它阅读它。

当然我只是以开放式办公室为例,但我的问题是一般性的,如何才能读取专有的输出文件?这里有什么想法?我知道有人会说逆向工程,但我不认为逆向工程整个软件在这里有意义(不是我对这个领域一无所知),因为我们的目标不是创建具有相同功能的软件。有没有办法只使用输出文件?

对此有何想法?

2 个答案:

答案 0 :(得分:3)

这是一个迭代过程:

  • 检查文件中的原始字节流并猜测它们的含义
  • 编写代码以验证猜测
  • 查看尝试加载文件时出现的问题
  • 重复

您需要各种各样的测试文件,耐心和大量洞察力。

我的经验是,处理基础知识非常简单,但复杂的文件格式功能可能很难处理。

答案 1 :(得分:0)

如果幸运的话,至少有关MS文件的一些信息有information on the doc file

另一方面,这是很多工作。基本上你做一个简单的文件保存它,然后做一个小的改变,保存并比较两者。最终你可以找出格式。