如何在pyspark数据框中选择或删除指定的行

时间:2019-11-17 14:28:28

标签: dataframe pyspark row

如何在pyspark数据框中选择或删除指定的行? 例如在数据框中删除第三行

1 个答案:

答案 0 :(得分:0)

您可以使用wherefilter函数来实现此目的,如下所示:-

df.filter($"age" > 15)
df.where($"age" > 15)

更新以按列索引删除

val col = df.columns
val n   = df.columns.length 
val toBeDropped = n-1 // to drop last column  and so on..
val oldDf = df.drop(col(ToBeDropped ))