按列表中的元素分组

时间:2019-10-09 14:15:08

标签: python pyspark pyspark-sql

我是PySpark的新手。 我创建了spark数据框,并且有一个“国家”列,其中包含国家/地区列表。 如何按国家列表中的单个国家/地区对数据框进行分组

zip

1 个答案:

答案 0 :(得分:0)

您可以查看PySpark官方文档。使用groupBy(它是pyspark.sql模块的一部分),功能u可以将数据框分组。 Latest PySpark doc 如果要按多个列进行分组,则只需传递一个带有* listname的列表即可。

data_frame_name.groupBy("countries")