匹配excel中的两列,拼写略有不同

时间:2017-07-17 11:38:12

标签: excel vba excel-vba analysis data-manipulation

我正在研究来自不同来源的大量excel表格。消息来源报告和记录信息的方式不同。因此,例如,人们会将该位置写为" Khurais"而另一个则将其写成" Khorais"。

由于这两个文件都包含重要信息,我想将它们合并到一个excel表中,以便我可以更轻松地处理它们。因此,如果您有任何您认为有益的建议或工具,请在此处分享。

P.S。 excel表中的单词是阿拉伯语单词的翻译。

3 个答案:

答案 0 :(得分:1)

您可以使用Levenshtein距离来确定两个单词是否"关闭"对彼此。基于你可以匹配。

答案 1 :(得分:0)

双重Metaphone 算法让人想起。它试图将字符串转换为语音表示。例如,“Folly”和“Pholee”应该具有相同的语音代码。

如果您可以生成这些代码,则可以根据它们而不是字符串匹配您的记录。

这是一篇解释的文章,以及示例VBA代码: https://bytes.com/topic/access/insights/965241-fuzzy-string-matching-double-metaphone-algorithm

希望能激励你:)

答案 2 :(得分:0)

您可以使用FuzzyLookup,这是一个允许您进行适当匹配的宏。它在过去对我来说非常好用,实际上已经有了很好的记录。

FuzzyLookup

您可以在此处找到它:https://www.mrexcel.com/forum/excel-questions/195635-fuzzy-matching-new-version-plus-explanation.html,包括如何使用它的示例。

希望有所帮助!

PS显然你也可以在VBA中严格使用它(不使用工作表函数)