尝试删除包含不等于(具有多个条件)的单元格的行

时间:2019-04-25 10:44:13

标签: pandas

我的数据集很大,需要删除一些行,例如包含文本“ Barking and Dagenham”的问题是我有多行包括在内:

吠叫和达格纳姆001A

吠叫和达格纳姆001B

吠叫和达格纳姆001C

吠叫和达格纳姆002A

问题已更改,这要归功于其他原因

摘要:

以上面的示例为例,我有56000行数据,需要删除“ Barking and Dagenham”以及其他类似“ Islington”和“ Bexley”的数据。 这样删除所有数据的最有效方法是什么?作为一种愚蠢的方法,我尝试使用多个定义(dfA,dfB,dfC等),然后使用pd.concat可以预期地出错了。

当我重写此问题时,我认为使用以下内容可能有效?

dfA = df[~df.LSOA.str.contains("Barking and Dagenham",na=False)]
dfB = dfA[~dfA.LSOA.str.contains("Islington",na=False)]
dfC = dfB[~dfB.LSOA.str.contains("Bexley",na=False)]

但是,这似乎过于复杂,并且可以简化,对此我将不胜感激。

0 个答案:

没有答案