将csv文件中的百分比绘制到matplotlib中

时间:2017-08-03 18:21:58

标签: python pandas matplotlib

我有一个叫做轨道返回的数据帧,我是从csv中提取的:

orbitalreturns = pd.DataFrame.from_csv('Orbital returns.csv',index_col=0,header=0) 

2014-02-28       NaN
2014-03-31     1.17%
2014-04-30     1.01%
2014-05-31     2.77%
2014-06-30     2.41%
2014-07-31    -5.44%

我只想绘制它但得到:

 TypeError: Empty 'DataFrame': no numeric data to plot

我试过了:

 orbitalreturns['OrbitalReturns'].strip('%') 

但得到:

AttributeError: 'Series' object has no attribute 'strip'

2 个答案:

答案 0 :(得分:1)

要使用字符串,您需要使用.str方法,如下所述:https://pandas.pydata.org/pandas-docs/stable/text.html#indexing-with-str

此代码应该有效(错误将导致NaN值 - 感谢评论):

orbitalreturns['OrbitalReturns'] = pd.to_numeric(orbitalreturns['OrbitalReturns'].str.strip('%'),errors='coerce')

打印时:

orbitalreturns["OrbitalReturns"]

你得到(看起来很好):

0    1.17
1    1.01
2    2.77
3    2.41
4   -5.44
Name: OrbitalReturns, dtype: float64

检查以下每个系列中的值

orbitalreturns['OrbitalReturns'].values
# array([nan, '1.17%', '1.01%', '2.77%', '2.41%', '-5.44%'], dtype=object)

orbitalreturns['OrbitalReturns'].str.strip("%").values
# array([nan, '1.17', '1.01', '2.77', '2.41', '-5.44'], dtype=object)

pd.to_numeric(orbitalreturns['OrbitalReturns'].str.strip("%")).values
# array([  nan,  1.17,  1.01,  2.77,  2.41, -5.44])

答案 1 :(得分:1)

删除%符号并转换为浮点数:

 orbitalreturns['OrbitalReturns'] = orbitalreturns['OrbitalReturns']\
                                        .str.strip('%').astype(float)