JavaRDD基于任何公共属性而变得与众不同

时间:2018-10-28 06:32:13

标签: java apache-spark

我有一个<div></div>,它基本上保存令牌值和令牌变体列表。我需要运行一个不同的操作,以便如果两个标记之间有任何匹配变化,则应将它们视为相同并且仅返回一次。

这是我的课程:

JavaRdd<Token>

这是一个数据示例:

public class Token {
   public String token;
   public String[] variations;
}

我不确定如何操纵RDD来获得所需的输出。

谢谢

0 个答案:

没有答案