我是PySpark的新手。 我创建了spark数据框,并且有一个“国家”列,其中包含国家/地区列表。 如何按国家列表中的单个国家/地区对数据框进行分组
zip
答案 0 :(得分:0)
您可以查看PySpark官方文档。使用groupBy(它是pyspark.sql模块的一部分),功能u可以将数据框分组。 Latest PySpark doc 如果要按多个列进行分组,则只需传递一个带有* listname的列表即可。
data_frame_name.groupBy("countries")