熊猫删除基于列中相同刺痛的行

时间:2021-03-31 10:25:29

标签: python pandas dataframe data-cleaning

Manufacturer               Buy Box Seller
0   Goli                   Goli Nutrition Inc.
1   Hanes                  3rd Street Brands
2   NaN                    Inspiring Life
3   Sports Research        Sports Research
4   Beckham Luxury Linen   Thalestris Co.

您好,我正在使用 Pandas DataFrame 来清理此文件,并想删除购买框卖家列中包含制造商名称的行。例如,第 1 行将被删除,因为它在 Buy-Box 卖家列中包含字符串“Goli”。

1 个答案:

答案 0 :(得分:2)

存在缺失值,因此首先将它们替换为 DataFrame.fillna,然后测试 DataFrame.apply 中的 not in statementaxis=1 中的列之间的值是否匹配,并在 {{3} 中进行过滤}:

mask = (df.fillna('Missing vals')
          .apply(lambda x: x['Manufacturer'] not in x['Buy Box Seller'], axis=1))
df = df[mask]