在Pyspark过滤操作

时间:2017-06-19 15:40:23

标签: apache-spark pyspark

我有一个数据框 dataframe1 ,我想从此数据框中获取一些过滤记录,我已成功应用喜欢 isin 操作它:

dataframe1.where((col('string_v').like("d_ms%"))).show()
dataframe1.where((col('string_v').isin("d_ms-92","d_ms_93"))).show()

但有些人可以帮助我如何使用pyspark应用过滤条件 not isin 不喜欢,我们将不胜感激。

1 个答案:

答案 0 :(得分:4)

无论

dataframe1.where(~(col('string_v').like("d_ms%"))).show()
dataframe1.where(~(col('string_v').isin("d_ms-92","d_ms_93"))).show()

from pyspark.sql.functions import not

dataframe1.where(not(col('string_v').like("d_ms%"))).show()
dataframe1.where(not(col('string_v').isin("d_ms-92","d_ms_93"))).show()