我的数据集很大,需要删除一些行,例如包含文本“ Barking and Dagenham”的问题是我有多行包括在内:
吠叫和达格纳姆001A
吠叫和达格纳姆001B
吠叫和达格纳姆001C
吠叫和达格纳姆002A
等
问题已更改,这要归功于其他原因
摘要:
以上面的示例为例,我有56000行数据,需要删除“ Barking and Dagenham”以及其他类似“ Islington”和“ Bexley”的数据。 这样删除所有数据的最有效方法是什么?作为一种愚蠢的方法,我尝试使用多个定义(dfA,dfB,dfC等),然后使用pd.concat可以预期地出错了。
当我重写此问题时,我认为使用以下内容可能有效?
dfA = df[~df.LSOA.str.contains("Barking and Dagenham",na=False)]
dfB = dfA[~dfA.LSOA.str.contains("Islington",na=False)]
dfC = dfB[~dfB.LSOA.str.contains("Bexley",na=False)]
但是,这似乎过于复杂,并且可以简化,对此我将不胜感激。