Pyspark在过滤后计数错误的数字

时间:2019-07-11 13:05:10

标签: apache-spark pyspark

我有一个下面的数据框,我应用了下面的操作,但没有给出错误的结果。请您帮忙解决这个问题吗?

joined_cases.count()

返回475

joined_cases.filter("stg_category_desc_txt in ('Bank', 'Institute')").count()

返回125

joined_cases.filter("stg_category_desc_txt not in ('Bank', 'Institute')").count()

返回287

0 个答案:

没有答案