是否可以使用由日期时间对象组成的列重新编制pandas DataFrame
索引?
我有一个DataFrame df
,其中包含以下列:
Int64Index: 19610 entries, 0 to 19609
Data columns:
cntr 19610 non-null values #int
datflt 19610 non-null values #float
dtstamp 19610 non-null values #datetime object
DOYtimestamp 19610 non-null values #float
dtypes: int64(1), float64(2), object(1)
我可以轻松地将df
重新索引到DOYtimestamp
df.reindex(index=df.dtstamp)
:DOYtimestamp
并且>>> df['DOYtimestamp'].values
array([ 153.76252315, 153.76253472, 153.7625463 , ..., 153.98945602,
153.98946759, 153.98947917])
具有以下值:
dtstamp
但我想重新索引由{date}对象组成的DataFrame,它由datetime对象组成,以便我直接从索引生成不同的时间戳。 dtstamp
列的值如下所示:
>>> df['dtstamp'].values
array([2012-06-02 18:18:02, 2012-06-02 18:18:03, 2012-06-02 18:18:04, ...,
2012-06-02 23:44:49, 2012-06-02 23:44:50, 2012-06-02 23:44:51],
dtype=object)
当我尝试重新引导df
dtstamp
时,我得到以下内容:
>>> df.reindex(index=df.dtstamp)
TypeError: can't compare datetime.datetime to long
我只是不确定我需要做什么才能使索引成为日期时间类型。有什么想法吗?
答案 0 :(得分:26)
听起来你不想要重新索引。有点令人困惑的是reindex
不是用于定义新索引的;相反,它查找具有指定索引的行。因此,如果您有一个索引为[0, 1, 2]
的DataFrame,那么执行reindex([2, 1, 0])
将以相反的顺序返回行。执行reindex([8, 9, 10])
之类的操作不会为行创建新索引;相反,它将返回一个带NaN
值的DataFrame,因为没有索引为8,9或10的行。
看起来你想要的只是保持相同的行,但为它们创建一个全新的索引。为此,您可以直接分配给索引。因此,请尝试df.index = df['dtstamp']
。