难以使用正则表达式替换Pandas列中的字符串吗?

时间:2018-03-13 02:00:34

标签: python regex pandas dataframe replace

所以,我已经学会处理Pandas数据帧中的缺失值,而我现在正尝试使用regex删除字符串格式的数字列中的某些缺失值。这是我pic的数据(以避免发布大量屏幕截图)。

我通常会使用.dropna来处理数字NaN,但由于缺失的值只是一个句点('.')在字符串Gold列中,这不起作用,我也无法将列转换为float,因为这样。

经过一些研究,这个正则表达式方法,

data5['Gold'].replace(r'\D',np.nan,regex=True,inplace=True)

替换所有不是数字的值'\D',应该有效,但是在此过程中每个值都为空,我似乎无法找出原因。有人有什么想法吗?

修改:在推荐之后,我尝试使用.to_dict复制粘贴我的麻烦数据的子集,以显示正在发生的事情。

Date           APPLE     IBM        Gold     VIX
67 2004-04-08  1.331187  69.479301  422.000  16.26
68 2004-04-12  1.355847  69.941895        .  15.28
69 2004-04-13  1.302174  69.419609  417.450  17.26
70 2004-04-14  1.288152  69.912048  405.750  15.62

0 个答案:

没有答案