我在pyspark中构建了一个数据帧,现在我想选择两列的值。我怎样才能做到这一点?
我试过了:
df.where((df['E'] ==0 ).where(df['C']=='non'))
谢谢
答案 0 :(得分:4)
您可以使用&
(和)逻辑运算符:
df.where((df['E'] == 0) & (df['C'] == 'non'))
答案 1 :(得分:1)
您可以在哪里过滤-
df.where((df.E == 0) & (df.C == 'non'))
##OR
df.filter((df.E == 0) & (df.C == 'non'))
答案 2 :(得分:0)
您可以直接使用sql语法:
df.where("E=0 and C='non'")