如何创建没有a日的日期时间列表?

时间:2019-02-03 15:16:38

标签: python list python-datetime

我需要从2007年1月1日00:00到2016年1月1日00:00每分钟创建一个日期时间元素列表,但没有2月29日。我的代码是下一个:

dates = []
date0 = datetime(2007, 1, 1, 0, 0)
delta = td(minutes=1)
while date0 < datetime(2016, 1, 1, 0, 0):
    if date0.date != date(2008, 2, 29) and date0.date != date(2012, 2, 29):
        dates.append(date0)
    date0 = date0 + delta

我应该有一份9年没有29.02的清单。但是我的日期列表仍然包含2008年2月29日和2012年2月29日。我试图应用此代码:

while date0 < datetime(2016, 1, 1, 0, 0):
    if date0.month != 2 and date0.day != 29:
        dates.append(date0)
    date0 = date0 + delta 

但是结果是我有一个列表,其中没有适当的天数,分别是8年14天。 您是否有解决此问题的解决方案或想法?

4 个答案:

答案 0 :(得分:1)

您可以使用pandas流行的外部数据处理包轻松完成此操作:

In []:
import pandas as pd
dr = pd.date_range(start='1/1/2007', end='1/1/2016', freq='1min')
dates = dr[(dr.day != 29) | (dr.month != 2)]

len(dr), len(dates)

Out[]:
(4733281, 4730401)

这大约需要700ms在我的计算机上。

In []:
dates

Out[]:
DatetimeIndex(['2007-01-01 00:00:00', '2007-01-01 00:01:00', '2007-01-01 00:02:00', '2007-01-01 00:03:00',
               '2007-01-01 00:04:00', '2007-01-01 00:05:00', '2007-01-01 00:06:00', '2007-01-01 00:07:00',
               '2007-01-01 00:08:00', '2007-01-01 00:09:00',
               ...
               '2015-12-31 23:51:00', '2015-12-31 23:52:00', '2015-12-31 23:53:00', '2015-12-31 23:54:00',
               '2015-12-31 23:55:00', '2015-12-31 23:56:00', '2015-12-31 23:57:00', '2015-12-31 23:58:00',
               '2015-12-31 23:59:00', '2016-01-01 00:00:00'],
              dtype='datetime64[ns]', length=4730401, freq=None)

答案 1 :(得分:1)

这是一种相对有效的Pure Python™方法。跳过leap天的方法很简单,只需将其包括在_DAYS_IN_MONTH表中(因此,根据要处理的当年是否是a年,不会进行任何特殊操作。) / p>

我不确定你为什么[想]为什么需要这个,但是最好通过generator function来做到这一点,这将消除在其中存储这么多datatime对象的需要记忆在同一时间。

from datetime import datetime

_DAYS_IN_MONTH = [31,28,31,30,31,30,31,31,30,31,30,31]  # Ignores leap days.

start_year, end_year = 2007, 2016
dates = []
for year in range(start_year, end_year):
    for month in range(1, 13):
        for day in range(1, _DAYS_IN_MONTH[month-1]+1):
            for hour in range(0, 24):
                for minute in range(0, 60):
                    dates.append(datetime(year, month, day, hour, minute))


print('len(dates): {:,d}'.format(len(dates)))  # -> len(dates): 4,730,400

答案 2 :(得分:0)

怎么样:

Iterator

答案 3 :(得分:0)

您无法将datetime对象的属性与对象本身进行比较,这就是导致问题的原因。

from datetime import datetime, timedelta

dates = []
date0 = datetime(2007, 1, 1, 0, 0)
delta = timedelta(minutes=1)


def get_leaps(startyear, endyear):
    leapyears = []
    for i in range(startyear, endyear):
        if (i%400 == 0)or ((i%4 == 0) and (i%100 != 0)):
            leapyears.append(i)
    for y in leapyears:
        for i in range(24):
            for j in range(60): 
                yield datetime(y, 2, 29, i, j))


while date0 < datetime(2016, 1, 1, 0, 0):
    if date0 not in get_leaps(2007, 2016):
        dates.append(date0)
    date0 += delta 

这应该是解决方案。这绝不是经过优化的,并且非常不合常规,但是请查看是否可以改进它。明天我要进行化学考试,而我没有时间。干杯!