我正在使用Sparklyr的以下配置:
sparklyr = 0.7.0
spark = 2.2.1
现在,我有两个矩阵作为sdf(m1,m2),想要计算下面的距离/相似度量:
我知道如何在“R”中执行此操作,即使用“代理”库:
library(proxy)
m4 = simil(m1,m2,method = "cosine",by_rows = TRUE)
m5 = dist(m1,m2,method = "Euclidean",by_rows = TRUE)
m6 = dist(m1,m2,method = "Manhattan",by_rows = TRUE)
请提供有关如何在sparklyr中计算此内容的解决方案。
感谢。