标签: java apache-spark
我有一个<div></div>,它基本上保存令牌值和令牌变体列表。我需要运行一个不同的操作,以便如果两个标记之间有任何匹配变化,则应将它们视为相同并且仅返回一次。
<div></div>
这是我的课程:
JavaRdd<Token>
这是一个数据示例:
public class Token { public String token; public String[] variations; }
我不确定如何操纵RDD来获得所需的输出。
谢谢