假设有一个数据集如下:
dataA: {
attribute1: x,
attribute2: y,
attribute3: z
}
我想计算相似结构化数据之间的相关性(例如:dataA, dataB, dataC ...
)
我对每个数据集的每个属性都有一个相似性度量。 (例如:x
与attribute1
的其他值的相似度为0.11,y
与attribute2
的其他值的相似度为0.22,z
与其他值的相似度attribute3
的值为0.33)
我将以加权平均方法呈现相关分数,其中为每个属性定义权重(例如:attribute1
的权重为w1
等):
Score for dataA = { (0.11 x w1) + (0.22 x w2) + (0.33 x w3) } / {w1 + w2 + w3}
如果我要进行实验以找到最佳体重,我该怎么做?
更新:
我可以进行实验来检查每个属性值的更改概率,然后以某种方式使用该值吗?