标签: scala apache-spark
我有Dataset[(A,B)]。我正在寻找unzip(Set[A,B]) => (Set[A], Set[B])之类的东西。我有什么选择?我没有在Dataset API中找到任何内容。我是否需要下载到RDD并重新启动它?
Dataset[(A,B)]
unzip(Set[A,B]) => (Set[A], Set[B])
这是由加入引起的,加入了便宜的'足够两次加入,只是反过来?由于这两套已经存在,因此似乎过多。
答案 0 :(得分:1)
我认为应该很明显的一个解决方案就是做两个步骤 val a = ds.map(_._1) val b = ds.map(_._2)
val a = ds.map(_._1) val b = ds.map(_._2)