我有一个叫做轨道返回的数据帧,我是从csv中提取的:
orbitalreturns = pd.DataFrame.from_csv('Orbital returns.csv',index_col=0,header=0)
2014-02-28 NaN
2014-03-31 1.17%
2014-04-30 1.01%
2014-05-31 2.77%
2014-06-30 2.41%
2014-07-31 -5.44%
我只想绘制它但得到:
TypeError: Empty 'DataFrame': no numeric data to plot
我试过了:
orbitalreturns['OrbitalReturns'].strip('%')
但得到:
AttributeError: 'Series' object has no attribute 'strip'
答案 0 :(得分:1)
要使用字符串,您需要使用.str方法,如下所述:https://pandas.pydata.org/pandas-docs/stable/text.html#indexing-with-str
此代码应该有效(错误将导致NaN值 - 感谢评论):
orbitalreturns['OrbitalReturns'] = pd.to_numeric(orbitalreturns['OrbitalReturns'].str.strip('%'),errors='coerce')
打印时:
orbitalreturns["OrbitalReturns"]
你得到(看起来很好):
0 1.17
1 1.01
2 2.77
3 2.41
4 -5.44
Name: OrbitalReturns, dtype: float64
检查以下每个系列中的值:
orbitalreturns['OrbitalReturns'].values
# array([nan, '1.17%', '1.01%', '2.77%', '2.41%', '-5.44%'], dtype=object)
orbitalreturns['OrbitalReturns'].str.strip("%").values
# array([nan, '1.17', '1.01', '2.77', '2.41', '-5.44'], dtype=object)
pd.to_numeric(orbitalreturns['OrbitalReturns'].str.strip("%")).values
# array([ nan, 1.17, 1.01, 2.77, 2.41, -5.44])
答案 1 :(得分:1)
删除%符号并转换为浮点数:
orbitalreturns['OrbitalReturns'] = orbitalreturns['OrbitalReturns']\
.str.strip('%').astype(float)