我有一本约有15,000条记录的字典,其格式如下:
sample = {0: {'Schedule': ['2017-05-11', '2019-04-30', '2018-10-13', '2019-05-31', '', '']},
1: {'Schedule': ['2017-05-09', '2019-05-31', '', '', '2018-10-13', '2019-05-31']},
2: {'Schedule': ['2017-05-02', '2020-02-29', '', '', '2018-10-12', '2020-02-29']}}
现在,我必须将'Schedule'
中的第1,第3和第5个日期与两个datetime对象进行比较,看看是否在该范围内。我正在执行以下操作,但结果非常缓慢,大约需要20秒。谁能建议一种更有效的搜索方式?
完整的示例代码:
from datetime import datetime
sample = {0: {'Schedule': ['2017-05-11', '2019-04-30', '2018-10-13', '2019-05-31', '', '']},
1: {'Schedule': ['2017-05-09', '2019-05-31', '', '', '2018-10-13', '2019-05-31']},
2: {'Schedule': ['2017-05-02', '2020-02-29', '', '', '2018-10-12', '2020-02-29']}}
start_date = datetime.date(datetime.strptime("2018-10-12","%Y-%m-%d"))
end_date = datetime.date(datetime.strptime("2018-10-16","%Y-%m-%d"))
for k,v in sample.items():
earliest = [dt for dt in [v["Schedule"][0],v["Schedule"][2],v["Schedule"][4]] if dt] #only need to check these 3 starting dates
def check_earliest(_list): #check if any date meets search criteria
for i in _list:
if start_date <= datetime.date(datetime.strptime(i, "%Y-%m-%d")) <= end_date:
return True
if check_earliest(earliest):
print ("Do something here...")
答案 0 :(得分:2)
不要使用日期时间对象,或以字典中的datetime
对象开头,因此您不必为了进行比较就将它们转换。
您不必使用datetime
对象,因为您的日期按YYYY-MM-DD的顺序ISO 8601 definition。这样的日期,例如字符串,按字典的正确顺序在按字母顺序可比较。
所以
start_date = "2018-10-12"
end_date = "2018-10-16"
for k,v in sample.items():
sched = v['Schedule']
earliest = [dt for dt in (sched[0], sched[2], sched[4]) if dt]
def check_earliest(l):
for i in l:
if start_date <= i <= end_date:
return True
if check_earliest(earliest):
print("Do something here...")
已经可以正常工作了。
我将在此处使用any()
函数来测试您的日期,而不是定义自己的函数:
for k, v in sample.items():
sched = v['Schedule']
if any(sched[i] and start_date <= sched[i] <= end_date for i in (0, 2, 4)):
print ("Do something here...")
对于代码的其他部分来说,将字符串解析为date()
实例一次 可能会很有用,而不是每次需要datetime.date()
时都使用字符串进行转换宾语。对于仅此比较,实际上并不需要。