标签: c# comparison
我有一些MHTML格式和pdf格式的文件。我想知道MHTML和PDF中的内容是否相同。我该如何比较差异?
答案 0 :(得分:3)
您需要一个MHTML解析器以及一个PDF解析器库。然后,您将并行浏览两个文档并比较内容。并不是说这绝对不容易,因为你必须在不同文件格式的元素之间构建一个映射系统。
如果您想要考虑内容可以用不同的方式编写(例如表格与标签),并且看起来与用户完全相同,那么事情会很快变得非常复杂。
从你提出问题的方式来看,我的直觉是这个项目比你准备好的更大,更复杂。