标签: apache-spark
我是Spark和Scala的新手。 我的RDD看起来像:
I1 I2 I3 I4
我需要通过参数
1 => I1 I2 I3 I4 2 => (I1, I2), (I1, I3)... 3 => (I1,I2,I3)...
结果不得包含(I2,I3,I2)
(I2,I3,I2)
订单无关紧要(I1, I2)与(I2, I1)相同。我该怎么做?
(I1, I2)
(I2, I1)
我尝试过使用内置函数,例如cartesin但是没有帮助......
我不知道该怎么做