我有一个minute
数据集,从:01.01.2017 00:00:00.000
到06.10.2017 23:59:00.000
它看起来像这样:
Gmt time, Open, Close
01.01.2017 00:00:00.000, 1.05148, 1.05153
01.01.2017 00:01:00.000, 1.05148, 1.05153
01.01.2017 00:02:00.000, 1.05148, 1.05153
...., ...., ....
01.01.2017 23:58:00.000, 1.05148, 1.05153
19.06.2017 23:59:00.000, 1.05148, 1.05153
现在我要做(对数据进行排序):
df = df.sort_values('Gmt time')
然后我做
df['Gmt time'] = pd.DatetimeIndex(df['Gmt time'])
然后执行:
df['Gmt time'].describe()
我得到了错误的first
和last
值。不仅如此,它似乎pd.DatetimeIndex
算错了。
新的first
和last
值为:
first 2017-01-01 00:00:00
last 2017-12-06 23:59:00
但是我的最后一个值应该是2017-06-19 23:59:00
什么原因导致这种情况发生?
测试案例:
我想添加一些可能有用的测试用例。如果数据集是从01.01.2017 00:00:00.000
到12.31.2017 23:59:00.000
的完整Year,那么我有正确的值。该数据集是一整年的分钟数据。