将函数应用于笛卡尔RDD

时间:2016-09-05 13:29:31

标签: scala apache-spark rdd levenshtein-distance

我正在尝试将函数应用于笛卡尔RDD。该函数采用from here,我不知道如何使其适用于笛卡尔RDD。

val newRDD = combined.map(Levenshtein.distance)

我的第一个想法是做

int *p[ ]

但它不起作用。

1 个答案:

答案 0 :(得分:5)

假设combined的类型为RDD[(String, String)]Levenshtein.distance有此签名:

def distance(s1:String, s2:String)

您可以按如下方式申请:

val newRDD = combined.map { case (s1, s2) => Levenshtein.distance(s1, s2) }

或者,或者:

val newRDD = combined.map(t => Levenshtein.distance(t._1, t._2))