过滤pyspark数据框

时间:2020-09-23 19:04:30

标签: pyspark pyspark-dataframes

我有一个名为property的表,该表有两列,分别名为property_id和property_amenities_id。下面是其中的几行。

我想获取具有[1,4] property_amenities_id的property_id。

因此,在此示例中,属性1和3具有property_amenities_id [1,4]。

property_id | property_amenities_id
      1     |          1
      1     |          4
      1     |          6
      2     |          3
      2     |          5
      3     |          1
      3     |          4 

我想将此过滤器应用于pyspark数据框。

任何人都可以帮助我找到更好的查询。

谢谢

0 个答案:

没有答案