查找日期是否在N对列表中重叠

时间:2013-08-26 11:05:22

标签: python algorithm date optimization

鉴于开始时间列表和开始时间,我想查找列表是否包含重叠条目:

timesok = [('9:30', '10:00'), ('10:00', '10:30'), ('10:30', '11:00')]

wrongtimes1 = [('9:30', '10:00'), ('9:00', '10:30'), ('10:30', '11:00')]
wrongtimes2=[('9:30', '10:00'), ('10:00', '10:30'), ('9:15', '9:45')]

我从这个非常相似的问题中借用了一些代码test overlapping pair of dates

def test_overlap(dt1_st, dt1_end, dt2_st, dt2_end):

    r1 = Range(start=dt1_st, end=dt1_end)
    r2 = Range(start=dt2_st, end=dt2_end)
    latest_start = max(r1.start, r2.start)
    earliest_end = min(r1.end, r2.end)
    overlap = (earliest_end - latest_start)
    return overlap.seconds

我测试条目列表的功能:

def find_overlaps(times):
    pairs = list(combinations(times, 2))
    print pairs
    for pair in pairs:
        start1 = dt.strptime(pair[0][0], '%H:%M')
        end1 = dt.strptime(pair[0][1], '%H:%M')
        start2 = dt.strptime(pair[1][0], '%H:%M')
        end2 = dt.strptime(pair[1][1], '%H:%M')
        yield test_overlap(start1, end1, start2, end2) > 0

使用时,它的工作原理如下:

In [257]: list(find_overlaps(timesok))
[(('9:30', '10:00'), ('10:00', '10:30')), (('9:30', '10:00'), ('10:30', '11:00')), (('10:00', '10:30'), ('10:30', '11:00'))]
Out[257]: [False, False, False]

In [258]: list(find_overlaps(wrongtimes1))
[(('9:30', '10:00'), ('9:00', '10:30')), (('9:30', '10:00'), ('10:30', '11:00')), (('9:00', '10:30'), ('10:30', '11:00'))]
Out[258]: [True, False, False]

In [261]: list(find_overlaps(wrongtimes2))
[(('9:30', '10:00'), ('10:00', '10:30')), (('9:30', '10:00'), ('9:15', '9:45')), (('10:00', '10:30'), ('9:15', '9:45'))]
Out[261]: [False, True, False]

然而:

  1. 如果这对大型名单非常有效,我仍在辩论自己。
  2. 我想知道是否有人可以提供更好的解决方案?

3 个答案:

答案 0 :(得分:1)

我建议用这种方法来测试重叠,这是一种查找日期所有交叉点的方法:

def test_overlap(dt1_st, dt1_end, dt2_st, dt2_end):
    return not (dt1_st < dt2_end and dt1_end >dt2_st)

这涵盖了重叠的所有可能性

答案 1 :(得分:0)

这类似于区间重叠问题。 详细阐述了pkacprzak的帖子。

按时间排序事件列表。 保留另一个活动元素列表。

线性处理......

对于每个事件/元素..

  1. 如果是起点,则添加到活动元素列表。
  2. 从活动元素列表中移除(如果是终点)。
  3. 此外,在每个起始点,当前活动元素与当前元素重叠。
  4. 另外,看看其他类似的区间重叠解决方案。就像这个。 how to overlap intervals efficiently

答案 2 :(得分:0)

如果没有两对同时启动,您可以将时间戳视为“午夜以来的分钟数”中的数值,然后按开始时间对输入列表进行排序,然后检查任何元素的结束时间是否更大而不是下一个元素的开始时间:

from operator import itemgetter
from itertools import izip

def asNumber(s):
    colon = s.find(':')
    return int(s[:colon]) * 60 + int(s[colon+1:])

def isValid(l):
  numericPairs = [(asNumber(a), asNumber(b)) for (a,b) in l]
  sortedPairs = sorted(numericPairs, key=itemgetter(0))
  return all(startB >= endA for ((startA, endA), (startB, endB)) in izip(sortedPairs, sortedPairs[1:]))