标签: database set cluster-analysis similarity
我有每个包含非常数元素的集合。它们在数据库中表示,如下所示(这是一个非常简单的例子)
我有两个问题
请注意,由于n,当前算法无法很好地扩展!复杂性。
注意:我可以更改数据库的表示以及用于计算相似度的算法。