比较文本时缺少/附加​​单词

时间:2014-11-26 19:40:08

标签: c# diff levenshtein-distance

我想比较两个文本文件。当只有拼写错误(缺少字符,错误字符或附加字符)时,我没有问题,但问题是当缺少行/单词或其他单词时。 在我的研究中,我发现很多人建议Levenshtein比较文本,但我不知道在这种情况下它是如何帮助的。 例: 如果text1是:

Montorgueil
1 Amalfi 8,20
1 Bali   3,90

和text2是:

H
Montorgueil
bali     3,90

我必须想办法说我还有一条额外的'H'线,一条丢失的线'1 Amalfi 8,20'和一张丢失的字母'1'

我可以使用任何算法吗?我甚至都在寻找代码。

0 个答案:

没有答案