在数据透视的情况下,我们只能获取其groupby和值作为列的列,但是如果我想保留其他列包含重复的列怎么办

时间:2018-10-01 15:04:05

标签: apache-spark apache-spark-sql

val domainCount = explodeDF
      .withColumn("tempColumn",split(explodeDF.col("flatDomain"),"~"))
      .withColumn($"tempColumn".getItem(0).toString() , 
                  $"tempColumn".getItem(1)) 

我在上面尝试过,但由于将列名的静态值保持为temp column0而无法正常工作。

id  tag  value
1   US    50
1   UK    100
1   Can   125
2   US    75
2   UK    150
2   Can   175

我想要:

id  US  UK   Can
1   50  100  125
2   75  150  175

谢谢

0 个答案:

没有答案