所以,我已经学会处理Pandas数据帧中的缺失值,而我现在正尝试使用regex
删除字符串格式的数字列中的某些缺失值。这是我pic的数据(以避免发布大量屏幕截图)。
我通常会使用.dropna
来处理数字NaN
,但由于缺失的值只是一个句点('.'
)在字符串Gold列中,这不起作用,我也无法将列转换为float,因为这样。
经过一些研究,这个正则表达式方法,
data5['Gold'].replace(r'\D',np.nan,regex=True,inplace=True)
替换所有不是数字的值'\D'
,应该有效,但是在此过程中每个值都为空,我似乎无法找出原因。有人有什么想法吗?
修改:在推荐之后,我尝试使用.to_dict
复制粘贴我的麻烦数据的子集,以显示正在发生的事情。
Date APPLE IBM Gold VIX
67 2004-04-08 1.331187 69.479301 422.000 16.26
68 2004-04-12 1.355847 69.941895 . 15.28
69 2004-04-13 1.302174 69.419609 417.450 17.26
70 2004-04-14 1.288152 69.912048 405.750 15.62