我想比较两个文本文件。当只有拼写错误(缺少字符,错误字符或附加字符)时,我没有问题,但问题是当缺少行/单词或其他单词时。 在我的研究中,我发现很多人建议Levenshtein比较文本,但我不知道在这种情况下它是如何帮助的。 例: 如果text1是:
Montorgueil
1 Amalfi 8,20
1 Bali 3,90
和text2是:
H
Montorgueil
bali 3,90
我必须想办法说我还有一条额外的'H'线,一条丢失的线'1 Amalfi 8,20'和一张丢失的字母'1'
我可以使用任何算法吗?我甚至都在寻找代码。