带有重复条目的数据透视表,而无需使用scala和spark-sql进行汇总/分组

时间:2019-04-24 06:34:29

标签: python pandas scala apache-spark-sql pivot

我遇到的情况与this问题中提到的情况类似。

但是我的完整项目在Scala中,我更愿意利用scala / spark-sql API来解决时间以及包构建和部署方面的约束。

在Scala中,我们是否有类似于pandas.DataFrame.unstack的方法?要么 一些UDF,还有其他方法可以实现这一目标吗?

0 个答案:

没有答案