Pandas DataFrame:删除非数字字符后的所有内容

时间:2017-03-14 09:15:46

标签: python regex string pandas dataframe

我有一个与此类似的问题:Pandas DataFrame: remove unwanted parts from strings in a column

不同之处在于我想在出现非数字字符后删除所有字符,例如:

    time    result
1   09:00   52m2 +6
2   10:00   62m2+balkon
3   11:00   57.+2 balkona
4   12:00   30 m2
5   13:00   46(43)

我需要将这些数据修剪为:

    time    result
1   09:00   52
2   10:00   62
3   11:00   57
4   12:00   30
5   13:00   46

我尝试了thisthis以及更多类似问题的解决方案,但我找不到具体的用例。

1 个答案:

答案 0 :(得分:1)

您可以使用extract

df.result = df.result.str.extract('(\d+)', expand=False)
print (df)
    time result
1  09:00     52
2  10:00     62
3  11:00     57
4  12:00     30
5  13:00     46