如何在mongoDB中实现模糊分组?

时间:2014-11-25 12:47:42

标签: mongodb group-by fuzzy-search

如何在mongoDB中实现模糊分组?

示例:

假设我有一个集合名称' TestCollection'可能包含重复记录或可能包含类似记录,所以我想将那些相似和重复的记录分组? 我知道即将找到部分真理的模糊逻辑(模糊算法)。

在我的情况下,它是关于两个字符串的相似性。这里是我使用模糊算法所做的:


string textToSearch= "2513, North Campus, Hudson Ln,Camp, USA";
string textToMatch= "A-284 bhalswa dairy, gurjar chowk nr yadav chowk bhalswa dairy, near Jhil, Bhalswa Dairy, USA";

var isTrue= DuoVia.FuzzyStrings.StringExtensions.FuzzyEquals(textToSearch, textToMatch, requiredProbabilityScore: 0.8);

在上面的示例中' isTrue'如果上述字符串的匹配概率等于或大于0.8,则为真,否则为假。

但我希望使用模糊算法在我的mongodb集合中找到类似的记录。

是否有任何库在mongoDB中使用C#或任何其他方法实现模糊搜索算法?

原始数据: enter image description here

预期输出:基于与0.7概率的模糊字符串匹配分组的类似记录:

enter image description here

0 个答案:

没有答案