Rdd获取项目

时间:2017-07-19 07:18:29

标签: apache-spark

我是Spark和Scala的新手。 我的RDD看起来像:

I1
I2
I3
I4

我需要通过参数

生成此rdd的所有组合
1 => I1 I2 I3 I4

2 => (I1, I2), (I1, I3)...

3 => (I1,I2,I3)...

结果不得包含(I2,I3,I2)

等重复项

订单无关紧要(I1, I2)(I2, I1)相同。我该怎么做?

我尝试过使用内置函数,例如cartesin但是没有帮助......

我不知道该怎么做

0 个答案:

没有答案