爆炸Spark中行的元组的动态数组

时间:2019-12-18 04:12:50

标签: scala apache-spark

我在rdd上进行了组聚合,逻辑有点复杂,必须返回这样的结果,其中每个数组开头的数字1、2是键。

Array[org.apache.spark.sql.Row] = 
                Array([1,(cat,List(7, 5, 2)),(dog,List(15, 13)), (monkey, List(1,2))], 
                      [2,(hen,List(1, 2, 3, 5)),(wolf,List(51, 42))])

如何使用Scala优雅地爆炸(不是某些字符串操作)。

预期结果:

col1|  col2  | col3
  1 |  cat   | List(7,5,2)
  1 |  dog   | List(15, 13)
  1 | monkey | List(1,2)
  2 |  hen   | List(1, 2, 3, 5)
 ................... and so on

0 个答案:

没有答案