使用pandas的情节似乎不能正常工作,因为我更改了DataFrame的索引

时间:2016-02-17 19:20:17

标签: python datetime pandas plot

我是Python和Pandas的新手。我写了一些代码来从Google财经下载1分钟的数据。使用以下命令后:

new = pd.read_csv(string, skiprows=7, names = ("d", "o", "h", "l", "c", "v") )

我获得了一个DataFrame,如下所示:

          d        o        h        l        c       v
0 a1453905960  95.4500  95.4500  95.0900  95.0980  433810
1 a1453906020  95.0500  95.4700  94.9500  95.4500  934980
2 a1453906080  94.9400  95.1000  94.8700  95.0900  791657
3 a1453906140  94.8990  95.0300  94.7000  94.9620  763531
4 a1453906200  94.9300  95.0300  94.8200  94.8918  501298

其中第一列是unix时间戳。

接下来,我使用以下行将unix时间戳转换为常规日期时间

new['d']=new['d'].apply(lambda x:datetime.fromtimestamp(int(x[1:])).strftime('%Y-%m-%d %H:%M:%S'))

现在我的d列包含带日期的字符串。如果我使用以下行

new.index = new["d"]
del new["d"]

我只是将旧索引替换为由包含日期时间的字符串组成的新索引。如果我使用以下命令绘制c列

new["c"].plot()

我获得了一个很好的情节。 "nice"

如果我使用以下命令将数据帧的索引转换为datetime对象

 new.index = pd.to_datetime(new.index)

然后我尝试

new["c"].plot()

我得到以下情节 bad plot

为什么呢?我误解了什么?

提前谢谢。

1 个答案:

答案 0 :(得分:1)

首先index来自stringd,因为strftime,其次是datetimeindex

可能datetime不正确,但datetime.fromtimestamp对我不起作用。

new['d']= new['d'].apply(lambda x: datetime.date.fromtimestamp(int(x[1:]))
                                                            .strftime('%Y-%m-%d %H:%M:%S'))
print new
                     d       o      h      l        c       v
0  2016-01-27 00:00:00  95.450  95.45  95.09  95.0980  433810
1  2016-01-27 00:00:00  95.050  95.47  94.95  95.4500  934980
2  2016-01-27 00:00:00  94.940  95.10  94.87  95.0900  791657
3  2016-01-27 00:00:00  94.899  95.03  94.70  94.9620  763531
4  2016-01-27 00:00:00  94.930  95.03  94.82  94.8918  501298

print new.dtypes
d     object
o    float64
h    float64
l    float64
c    float64
v      int64
dtype: object

print type(new.loc[0, 'd'])
<type 'str'>

new.index = new["d"]
del new["d"]

print new.index
Index([u'2016-01-27 00:00:00', u'2016-01-27 00:00:00', u'2016-01-27 00:00:00',
       u'2016-01-27 00:00:00', u'2016-01-27 00:00:00'],
      dtype='object', name=u'd')

new.index = pd.to_datetime(new.index)
print new.index
DatetimeIndex(['2016-01-27', '2016-01-27', '2016-01-27', '2016-01-27',
               '2016-01-27'],
              dtype='datetime64[ns]', name=u'd', freq=None)

也许您可以使用创建列d使用to_datetime

new['d'] = pd.to_datetime(new['d'].str[1:].astype(int), unit='s')

或者如果您需要使用字符串strftime

new['d'] = pd.to_datetime(new['d'].str[1:].astype(int), unit='s').dt.strftime('%Y-%m-%d %H:%M:%S')