计算相似度分数的权重

时间:2017-09-29 09:03:25

标签: algorithm math

假设有一个数据集如下:

dataA: {
  attribute1: x,
  attribute2: y,
  attribute3: z
}

我想计算相似结构化数据之间的相关性(例如:dataA, dataB, dataC ...

我对每个数据集的每个属性都有一个相似性度量。 (例如:xattribute1的其他值的相似度为0.11,yattribute2的其他值的相似度为0.22,z与其他值的相似度attribute3的值为0.33)

我将以加权平均方法呈现相关分数,其中为每个属性定义权重(例如:attribute1的权重为w1等):

Score for dataA = { (0.11 x w1) + (0.22 x w2) + (0.33 x w3) } / {w1 + w2 + w3}

如果我要进行实验以找到最佳体重,我该怎么做?

更新:

我可以进行实验来检查每个属性值的更改概率,然后以某种方式使用该值吗?

1 个答案:

答案 0 :(得分:1)