我想与您讨论哪种相似性措施符合我的要求。我的载体可能看起来像那样:
A = (-4,0,4,null)
B = (-2,null,-4,null)
C = (4,4,4,4)
D = (0,0,0,0)
E = (null,null,null,null)
F = (-4,-4,-4,-4)
值是-5到+5范围内的活动值。值0表示非活动值,值接近-5和+5表示高活动值。所以我正在寻找合适的相似性度量。
我想获得这些载体的所有组合之间的相似性。我认为C和F之间的相似性必须为1,C和D之间的相似性必须为0:
C:E = 0
C:F = 1
C:D = 0
A:B = i think something over 0.5
我希望你能解开我的要求。我现在的问题是:哪种相似性度量可以满足我的要求?
编辑:
答案 0 :(得分:1)
这是相当复杂的,首先要使C和F相似,你想要以绝对值开始。同样,看起来null应该被翻译成0。
这将导致元素仅在0..5范围内的向量,这简化了问题。
然后问题是你想怎么做,首先采取组件明智的差异可能是一个好的开始,那么问题是如何将它们加权在一起,随机猜测可能只是线性组合或可能是二次方的
实际上,在最后一步中,它过分依赖于你的用例来说明任何有用的东西,但我认为如果你可以从所有元素进入0..5范围开始,那么就会获得很多。