如何检查2个大文本文件内容是否100%相同?

时间:2011-06-29 09:27:27

标签: .net vb.net text-files

我有两个大文本文件(大约1.8 GB,每个文件用UTF-8编码)。我想检查两个文件的内容是否100%相同。如果存在单个字符差异则认为不相同,即两个文件都不同。我该怎么做?

所以我的问题是:如何检查2个大文本文件内容是否100%相同?

Dim TextFile1 as String = "C:\TextFile1.log"
Dim TextFile2 as String = "C:\TextFile2.log"

更新

我忘了添加,解决方案应该是使用最少的内存,因为特定的PC只有256 MB的内存

2 个答案:

答案 0 :(得分:1)

嗯,对于初学者,你可以比较他们的大小(如果他们的大小不同,他们就不能拥有相同的内容)。请查看FileInfo.Length属性。

如果它们具有相同的尺寸,您可以compare them byte by byte

答案 1 :(得分:1)

我遇到了类似的问题,我需要识别名称已更改的重复pdf文件。执行此操作的最佳方法是使用md5哈希。 我做了一个快速的谷歌搜索,它看起来vb.net确实有内置功能的支持来做到这一点。查看 http://www.vbknowledgebase.com/?Id=88&Desc=Find-Duplicate-files-using-Vb.Net-using-MD5-Hash