有没有人知道将两个字符串比较在一起以产生两者之间的“差异量”的简单方法? (在一个数值)我一直在抓住谷歌运气不好。在做了一些编码后,它并不像我想象的那么简单。有线索吗?
答案 0 :(得分:5)
你在谈论“编辑距离”吗?搜索SO或Google上的“Levenshtein距离”。我使用Stephen Toub's blog
上发布的版本答案 1 :(得分:2)
您正在寻找Levenshtein distance。
答案 2 :(得分:1)
您可能希望查看Levenshtein和Hamming距离。一个计算编辑距离(插入,删除,修改),另一个计算翻转。
答案 3 :(得分:0)
您需要非常清楚地定义“差异量”。那里有很多摆动的空间。
例如,旧的C / C ++函数strcmp()
函数逐字符比较,并在第一次不匹配时返回差异。
另一方面,diff程序提供了两个文件之间差异的综合列表(在某种意义上,它们也是字符串)。你会如何量化?