从DataFrame字符串对象中提取数值

时间:2015-06-11 00:17:28

标签: regex pandas extract dataframe numerical

我有一个dtype字符串的DataFrame对象。典型的行如下所示:

'\n\n              Dividend Indicated Gross Yield\n          \n\n              1.50%\n          \n'

我试图仅从上面的字符串中提取数值数据。例如,我想要的输出应该是1.50

要记住的另一件事是每行的数字长度不同,有些也可能包含负号。

我尝试了一些涉及.rstrip()regexconvert_objects的建议,但它们并没有按预期工作。任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:2)

你可能想这样做:

df.col.str.extract('(\-?\d+\.\d+)').astype(np.float64)