我想将DataFrame中的列从OBJECT转换为INT。我需要完全删除包含字符串的行。
以下表达式“保存”我关心的数据,并将列从OBJECT转换为INT类型:
df["column name"] = df["column name"].astype(str).str.replace(r'/\d+$', '').astype(int)
但是,在此之前,我要完全删除包含字母(A-Z)的行。
我尝试过:
df[~df["column name"].str.lower().str.startswith('A-Z')]
我也尝试了其他一些表达式,但是没有数据清除。
DataFrame看起来像这样:
A B C
0 8161 0454 9600
1 - 3780 1773 1450
2 2564 0548 5060
3 1332 9179 2040
4 6010 3263 1050
5 I Forgot 7849 1400/10000
Col C-1400/10000-我写的第一个表达式只是删除了“ / 10000”并保持为“ 1400”
现在我需要删除单词表达式,如“ A5”中一样
答案 0 :(得分:1)
使用正则表达式可以为包含[a-z]之间的字符的所有行创建一个掩码。然后,您可以删除此行。像这样:
</div>