Question

我想从月份2019-01开始，然后添加任意数量的相应月份，并将其用作熊猫数据框中的索引。我已经找到了使用pd.to_timedelta的建议，但是我一直在摸索问题。

以下是详细信息：

如果您以日期开头并添加5个句点，例如：

import pandas as pd
import numpy as np

date = pd.to_datetime("1st of Jan, 2019")
dates = date+pd.to_timedelta(np.arange(5), 'M')

然后您得到：

DatetimeIndex(['2019-01-01 00:00:00', '2019-01-31 10:29:06',
               '2019-03-02 20:58:12', '2019-04-02 07:27:18',
               '2019-05-02 17:56:24'],
              dtype='datetime64[ns]', freq=None)

您可以轻松地删除日期和时间部分，并删除重复项以处理双2019-01，如下所示：

dates = dates.map(lambda x: x.strftime('%Y-%m'))
dates = dates.drop_duplicates()

但是您可以看到，2019-02丢失了：

Index(['2019-01', '2019-03', '2019-04', '2019-05'], dtype='object')

有什么更好的方法？

如何创建一个年月系列用作熊猫数据框中的索引？

0 个答案: