我正在比较5年(2007-2011)记录的每小时数据测量值,其中每年的测量数量如下:
2007 = 8760 measurements;
2008 = 8784 measurements; <-- leap year
2009 = 8760 measurements;
2010 = 8760 measurements;
2011 = 8760 measurements;
比较每个时间序列的最佳方法是什么?在非闰年2月29日增加额外的24次测量(nans)是否更好?或者,将数据插入到同一时间范围(每年的十进制日给出时间)是否更有效?
答案 0 :(得分:2)
这完全取决于您所测量的数据类型。如果它是像天气数据一样的自然世界的东西,你可能更关心将冬至与冬至和昼夜平分点相匹配。如果是金融市场数据,您可能需要排列日历,并可能完全排除闰日。
如果没有更多背景知识,很难提供更具体的建议。