数据库中的相似度计算

时间:2014-09-24 11:06:52

标签: database set cluster-analysis similarity

我有每个包含非常数元素的集合。它们在数据库中表示,如下所示(这是一个非常简单的例子)

我有两个问题

  1. 如何有效地计算相似度?
  2. 如何在数据库中表示计算出的相似度?
  3. 请注意,由于n,当前算法无法很好地扩展!复杂性。

    注意:我可以更改数据库的表示以及用于计算相似度的算法。

    Image representing the before and after states of the problem

0 个答案:

没有答案