包含相关项的不同长度向量之间的相似性

时间:2014-06-02 10:43:35

标签: r vector compare analytics similarity

我有一个矢量(V1),我需要用它来计算其他矢量(ex V2,V3 ......)的相似度,这些矢量可能有不同的长度。 这里不同的角度是矢量内部的元素本身彼此相似。

V1 = c("a","b","c")
V2 = c("a","d","e","f","g")
V3 = c("b","c","f")

元素彼此相似,例如:

      a      b        c       d       e       f      g
a   1.00    0.18    0.01    0.96    0.12    0.46    0.73
b           1.00    0.07    0.36    0.13    0.47    0.92
c                   1.00    0.88    0.62    0.65    0.31
d                           1.00    0.86    0.96    0.55
e                                   1.00    0.25    0.91
f                                           1.00    0.13
g                                                   1.00

通常的相似性方法,如余弦相似性,相关性不利用向量元素之间的相似性。我想计算V1,V2和V3之间的相似性。

预期结果:

    V1  V2  V3
V1  1   x   y
V2      1   z
V3          1

0 个答案:

没有答案