我正在研究来自不同来源的大量excel表格。消息来源报告和记录信息的方式不同。因此,例如,人们会将该位置写为" Khurais"而另一个则将其写成" Khorais"。
由于这两个文件都包含重要信息,我想将它们合并到一个excel表中,以便我可以更轻松地处理它们。因此,如果您有任何您认为有益的建议或工具,请在此处分享。
P.S。 excel表中的单词是阿拉伯语单词的翻译。
答案 0 :(得分:1)
您可以使用Levenshtein距离来确定两个单词是否"关闭"对彼此。基于你可以匹配。
答案 1 :(得分:0)
双重Metaphone 算法让人想起。它试图将字符串转换为语音表示。例如,“Folly”和“Pholee”应该具有相同的语音代码。
如果您可以生成这些代码,则可以根据它们而不是字符串匹配您的记录。
这是一篇解释的文章,以及示例VBA代码: https://bytes.com/topic/access/insights/965241-fuzzy-string-matching-double-metaphone-algorithm
希望能激励你:)
答案 2 :(得分:0)
您可以使用FuzzyLookup,这是一个允许您进行适当匹配的宏。它在过去对我来说非常好用,实际上已经有了很好的记录。
您可以在此处找到它:https://www.mrexcel.com/forum/excel-questions/195635-fuzzy-matching-new-version-plus-explanation.html,包括如何使用它的示例。
希望有所帮助!
PS显然你也可以在VBA中严格使用它(不使用工作表函数)