根据确切的数组匹配过滤pyspark数据框

时间:2019-02-05 10:13:41

标签: python arrays apache-spark pyspark

我进行了搜索,但是只发现了很多问题(例如12),这些问题都在寻找array_contains()。但是,我想基于与输入完全匹配的数组列过滤数据框:

df_new = df.where(F.col("myArrayTypeCol") == ["ab", "cd"])

这给了我以下错误:

  

java.lang.RuntimeException:不支持的文字类型类java.util.ArrayList

我确切地知道我想要的数组是什么样的。我该如何过滤?

0 个答案:

没有答案