Cosine,Euclidean,曼哈顿距离计算在Sparklyr

时间:2018-02-14 18:39:30

标签: r sparklyr

我正在使用Sparklyr的以下配置:

sparklyr = 0.7.0
spark = 2.2.1

现在,我有两个矩阵作为sdf(m1,m2),想要计算下面的距离/相似度量:

  1. 余弦
  2. 欧几里德
  3. 曼哈顿
  4. 我知道如何在“R”中执行此操作,即使用“代理”库:

    library(proxy)
    m4 = simil(m1,m2,method = "cosine",by_rows = TRUE)
    
    m5 = dist(m1,m2,method = "Euclidean",by_rows = TRUE)
    
    m6 = dist(m1,m2,method = "Manhattan",by_rows = TRUE)
    

    请提供有关如何在sparklyr中计算此内容的解决方案。

    感谢。

0 个答案:

没有答案