pandas使用datetime对象重新索引DataFrame

时间:2012-06-08 05:24:58

标签: python dataframe pandas reindex

是否可以使用由日期时间对象组成的列重新编制pandas DataFrame索引?

我有一个DataFrame df,其中包含以下列:

Int64Index: 19610 entries, 0 to 19609
Data columns:
cntr                  19610  non-null values  #int
datflt                19610  non-null values  #float
dtstamp               19610  non-null values  #datetime object
DOYtimestamp          19610  non-null values  #float
dtypes: int64(1), float64(2), object(1)

我可以轻松地将df重新索引到DOYtimestamp df.reindex(index=df.dtstamp)DOYtimestamp 并且>>> df['DOYtimestamp'].values array([ 153.76252315, 153.76253472, 153.7625463 , ..., 153.98945602, 153.98946759, 153.98947917]) 具有以下值:

dtstamp

但我想重新索引由{date}对象组成的DataFrame,它由datetime对象组成,以便我直接从索引生成不同的时间戳。 dtstamp列的值如下所示:

 >>> df['dtstamp'].values
     array([2012-06-02 18:18:02, 2012-06-02 18:18:03, 2012-06-02 18:18:04, ...,
     2012-06-02 23:44:49, 2012-06-02 23:44:50, 2012-06-02 23:44:51], 
     dtype=object)

当我尝试重新引导df dtstamp时,我得到以下内容:

>>> df.reindex(index=df.dtstamp)
    TypeError: can't compare datetime.datetime to long

我只是不确定我需要做什么才能使索引成为日期时间类型。有什么想法吗?

1 个答案:

答案 0 :(得分:26)

听起来你不想要重新索引。有点令人困惑的是reindex不是用于定义新索引的;相反,它查找具有指定索引的行。因此,如果您有一个索引为[0, 1, 2]的DataFrame,那么执行reindex([2, 1, 0])将以相反的顺序返回行。执行reindex([8, 9, 10])之类的操作不会为行创建新索引;相反,它将返回一个带NaN值的DataFrame,因为没有索引为8,9或10的行。

看起来你想要的只是保持相同的行,但为它们创建一个全新的索引。为此,您可以直接分配给索引。因此,请尝试df.index = df['dtstamp']