如何比较不同类型的两个文件的内容?

时间:2011-07-21 09:42:04

标签: c# comparison

我有一些MHTML格式和pdf格式的文件。我想知道MHTML和PDF中的内容是否相同。我该如何比较差异?

1 个答案:

答案 0 :(得分:3)

您需要一个MHTML解析器以及一个PDF解析器库。然后,您将并行浏览两个文档并比较内容。并不是说这绝对不容易,因为你必须在不同文件格式的元素之间构建一个映射系统。

如果您想要考虑内容可以用不同的方式编写(例如表格与标签),并且看起来与用户完全相同,那么事情会很快变得非常复杂。

从你提出问题的方式来看,我的直觉是这个项目比你准备好的更大,更复杂。