pyspark:如何在数据框中选择两个查询

时间:2018-04-22 00:35:52

标签: pyspark pyspark-sql

我在pyspark中构建了一个数据帧,现在我想选择两列的值。我怎样才能做到这一点?

我试过了:

df.where((df['E'] ==0 ).where(df['C']=='non'))

谢谢

3 个答案:

答案 0 :(得分:4)

您可以使用&(和)逻辑运算符:

df.where((df['E'] == 0) & (df['C'] == 'non'))

答案 1 :(得分:1)

您可以在哪里过滤-

df.where((df.E == 0) & (df.C == 'non'))

##OR

df.filter((df.E == 0) & (df.C == 'non'))

答案 2 :(得分:0)

您可以直接使用sql语法:

df.where("E=0 and C='non'")