使用Regex清理数据框列中的数据-Python

时间:2019-04-01 14:53:48

标签: python regex pandas dataframe

我有一个带有对象类型“动力”汽车列的数据框。我需要获取ch的数值。数据就像:

df = pd.DataFrame({'power': ['265 kW (360 ch)', '125 à 135 kW (170 à 184 ch)', '244 kW (332 ch) en 75D,']})

这就是我所需要的:

df = pd.DataFrame({'power': [360, 184, 332]})

正则表达式运算符可以帮助我吗?或者也许不用Regex就能拥有其他技术专长?

注意:这不仅是如何在字符串中获取简单数字的问题,请 Wiktor Stribizew 先生,不要再将人的问题标记为重复!抱歉,您稍后再回答!谢谢

1 个答案:

答案 0 :(得分:1)

您可以将df.applyre.search一起使用:

>>> df.power.apply(lambda x: re.search(r'(\d+) ch', x).group(1))
0    360
1    184
2    332