删除包含字符串的行-Pandas数据框

时间:2019-07-24 07:54:10

标签: python regex pandas dataframe

我想将DataFrame中的列从OBJECT转换为INT。我需要完全删除包含字符串的行。

以下表达式“保存”我关心的数据,并将列从OBJECT转换为INT类型:

df["column name"] = df["column name"].astype(str).str.replace(r'/\d+$', '').astype(int)

但是,在此之前,我要完全删除包含字母(A-Z)的行。

我尝试过:

df[~df["column name"].str.lower().str.startswith('A-Z')]

我也尝试了其他一些表达式,但是没有数据清除。

DataFrame看起来像这样:

          A         B         C
0       8161       0454   9600
1 -     3780       1773   1450
2       2564       0548   5060
3       1332       9179   2040
4       6010       3263   1050
5   I Forgot       7849   1400/10000

Col C-1400/10000-我写的第一个表达式只是删除了“ / 10000”并保持为“ 1400”

现在我需要删除单词表达式,如“ A5”中一样

1 个答案:

答案 0 :(得分:1)

使用正则表达式可以为包含[a-z]之间的字符的所有行创建一个掩码。然后,您可以删除此行。像这样:

</div>