如何在mongoDB中实现模糊分组?
示例:
假设我有一个集合名称' TestCollection'可能包含重复记录或可能包含类似记录,所以我想将那些相似和重复的记录分组? 我知道即将找到部分真理的模糊逻辑(模糊算法)。
在我的情况下,它是关于两个字符串的相似性。这里是我使用模糊算法所做的:
string textToSearch= "2513, North Campus, Hudson Ln,Camp, USA"; string textToMatch= "A-284 bhalswa dairy, gurjar chowk nr yadav chowk bhalswa dairy, near Jhil, Bhalswa Dairy, USA"; var isTrue= DuoVia.FuzzyStrings.StringExtensions.FuzzyEquals(textToSearch, textToMatch, requiredProbabilityScore: 0.8);
在上面的示例中' isTrue'如果上述字符串的匹配概率等于或大于0.8,则为真,否则为假。
但我希望使用模糊算法在我的mongodb集合中找到类似的记录。
是否有任何库在mongoDB中使用C#或任何其他方法实现模糊搜索算法?
原始数据:
预期输出:基于与0.7概率的模糊字符串匹配分组的类似记录: