我有一个dtype字符串的DataFrame对象。典型的行如下所示:
'\n\n Dividend Indicated Gross Yield\n \n\n 1.50%\n \n'
我试图仅从上面的字符串中提取数值数据。例如,我想要的输出应该是1.50
。
要记住的另一件事是每行的数字长度不同,有些也可能包含负号。
我尝试了一些涉及.rstrip()
,regex
,convert_objects
的建议,但它们并没有按预期工作。任何帮助表示赞赏。
答案 0 :(得分:2)
你可能想这样做:
df.col.str.extract('(\-?\d+\.\d+)').astype(np.float64)