使用R查找数据帧之间的余弦相似度

时间:2016-01-07 06:44:37

标签: r dataframe cosine-similarity

我有两个数据框,包含来自不同医院的信息。第一个有可能的登革热病例,第二个有确认的登革热病例数。每周给出数据。我的数据长达53周或1年。      实施例 -

    Data Frame 1(Probable cases)
    HospitalName Week1 Week 2
         xyz       8     12
         abc       9      0
    Data Frame 2(Laboratory verified cases)
    HospitalName Week1 Week 2
         xyz       3     11
         abc      14      0

两个数据框在相应的行中具有相同的医院名称。 我想在R中使用余弦相似性找到两个数据帧之间的相似性。怎么做?

1 个答案:

答案 0 :(得分:0)

install.packages("proxy")
dist(x,y,method = "cosine")

#       [,1]       [,2]      
#[1,] 0.03909305 0.44529980
#[2,] 0.23661371 0.00000000

x和y是第1周,第2周来自df1和第1周,第2周来自df2

x <- as.matrix(Data Frame 1[,2:3])
y <- as.matrix(Data Frame 2[,2:3])