应用错误收集

数据库中的相似度计算

时间：2014-09-24 11:06:52

标签： database set cluster-analysis similarity

我有每个包含非常数元素的集合。它们在数据库中表示，如下所示（这是一个非常简单的例子）

我有两个问题

如何有效地计算相似度？
如何在数据库中表示计算出的相似度？

请注意，由于n，当前算法无法很好地扩展！复杂性。

注意：我可以更改数据库的表示以及用于计算相似度的算法。

Image representing the before and after states of the problem

0 个答案:

没有答案