以降序对pyspark数据框进行排序

时间:2019-11-18 07:13:24

标签: pyspark pyspark-sql pyspark-dataframes

我的数据框看起来像-

id      item      sale
1        a        100
2        b        300
3        c        200
4        d        800
5        e        400

我希望数据帧按降序排序。我的最终输出应该是-

id      item      sale
4        d        800
5        e        400
2        b        300
3        c        200
1        a        100

我的代码是-

df = df.orderBy('sale',ascending = False)

但是给我错误的结果。

1 个答案:

答案 0 :(得分:0)

检查列销售的数据类型。它必须是Interger,Decimal或float。您可以通过以下方式查看列类型:

df.dtypes

此外,您可以尝试使用以下方式对数据框进行排序:

df = df.sort(col("sale").desc())