将一年中的小数部分转换为Pandas Datetime

时间:2017-10-20 22:18:34

标签: python pandas datetime

我有一个Pandas DataFrame列,它是一年中的小数日(DOY)。此列显示为:

               DOY
0       200.749967
1       200.791667
2       200.833367
3       200.874967
4       200.916667
5       200.958367
6       200.999967
7       201.041667
       ...    
3491    627.166667
3492    627.333367
3493    627.499967
3494    627.666667
3495    627.833367
3496    627.999967
3497    628.166667
3498    628.333367
Name: DOY, Length: 3499, dtype: float64

起始年份是2011年,但是DOY数据继续增加到2012年的价值,而在新的一年没有重置为零。

如何将其转换为Pandas DatetimeIndex,格式为' YYYY-MM-DD HH:MM:SS'?

3 个答案:

答案 0 :(得分:3)

我能想到的一种方法是将您的列转换为TimeDelta,然后将其添加到基本偏移量(2011/1/1)。

df.DOY = pd.to_datetime('2011-1-1') + pd.to_timedelta(df.DOY, unit='D')
print(df.DOY)
0      2011-07-20 17:59:57.148800
1      2011-07-20 19:00:00.028800
2      2011-07-20 20:00:02.908800
3      2011-07-20 20:59:57.148800
4      2011-07-20 22:00:00.028800
5      2011-07-20 23:00:02.908800
6      2011-07-20 23:59:57.148800 
7      2011-07-21 01:00:00.028800
       ... 
3491   2012-09-19 04:00:00.028800
3492   2012-09-19 08:00:02.908800
3493   2012-09-19 11:59:57.148800
3494   2012-09-19 16:00:00.028800
3495   2012-09-19 20:00:02.908800
3496   2012-09-19 23:59:57.148800
3497   2012-09-20 04:00:00.028800
3498   2012-09-20 08:00:02.908800
Name: DOY, dtype: datetime64[ns]

另一种方法是使用pd.to_datetime参数集调用origin,如their answer中显示的那样。

答案 1 :(得分:3)

虽然在将DOY转换为Datetime时接受的答案是正确的,但是有一个小错误被忽略了。

任何一年的1月1日午夜都是DOY 1.0。当您继续进行小数DOY时,1月1日12:00是DOY 1。1,1月2日00:00是DOY 2.0等...

如果您将DOY时间添加到基准偏移日期,如其他答案所示,结果时间会向前偏移一天。例如,pd.to_datetime('2011-01-01') + pd.to_timedelta(df.DOY, unit='D'),DOY系列以1.0开头,会导致开始日期为' 2011-01-02'哪个不对。这是惯例的结果,DOY时间从1而不是0开始。有关详细信息,请参阅here

因此,正确的答案(产生正确的日期时间结果)是:

df.DOY = pd.to_datetime('2011-1-1') + pd.to_timedelta(gps.DOY, unit='D') - pd.Timedelta(days=1)

答案 2 :(得分:2)

只需将to_datetime与适当的参数(read the manual)一起使用:

>>> pandas.to_datetime([0,0.1,200,400,800], unit='D', origin=pandas.Timestamp('01-01-2011'))

DatetimeIndex(['2011-01-01 00:00:00', '2011-01-01 02:24:00', '2011-07-20 00:00:00', '2012-02-05 00:00:00', '2013-03-11 00:00:00'], dtype='datetime64[ns]', freq=None)