比较日期的替代strptime?

时间:2016-09-02 15:42:37

标签: python regex loops strptime

有没有办法比较两个日期而不是每次在python中调用strptime?我确定我的问题没有其他方法,但我想确保我已经检查了所有选项。

我正在浏览一个非常大的日志文件,每行都有一个我需要比较的日期,以查看该日期是否在其他两个日期的范围内。我不得不用strptime转换每一行的每个日期,这会导致一个巨大的瓶颈;

Fri Sep  2 15:12:43 2016    output2.file

         63518075 function calls (63517618 primitive calls) in 171.409 seconds

   Ordered by: cumulative time
   List reduced from 571 to 10 due to restriction <10>

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.003    0.003  171.410  171.410 script.py:3(<module>)
        1    0.429    0.429  171.367  171.367 scipt.py:1074(main)
        1    3.357    3.357  162.009  162.009 script.py:695(get_data)
  1569898   14.088    0.000  141.175    0.000 script.py:648(check_line)
  1569902    6.899    0.000   71.706    0.000 {built-in method strptime}
  1569902   31.198    0.000   64.805    0.000 /usr/lib64/python2.7/_strptime.py:295(_strptime)
  1569876   15.324    0.000   43.170    0.000 script.py:626(dict_add)
  4709757   23.370    0.000   23.370    0.000 {method 'strftime' of 'datetime.date' objects}
  1569904    1.655    0.000   18.799    0.000 /usr/lib64/python2.7/_strptime.py:27(_getlang)
  1569899    2.103    0.000   17.452    0.000 script.py:592(reverse)

日期格式如下;

current_date = 01/Aug/1995:23:59:53

我正在比较这些;

with open(logfile) as file:
    for line in file:
        current_date = strptime_method(line)
        if current_date => end_date:
            break

在比较日期时还有其他选择吗?

编辑:谢谢大家,特别是user2539738。这是基于他/她的建议的结果,大的速度差异;

Fri Sep  2 16:14:59 2016    output3.file

         24270567 function calls (24270110 primitive calls) in 105.466 seconds

   Ordered by: cumulative time
   List reduced from 571 to 10 due to restriction <10>

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.002    0.002  105.466  105.466 script.py:3(<module>)
        1    0.487    0.487  105.433  105.433 script.py:1082(main)
        1    3.159    3.159   95.861   95.861 script.py:702(get_data)
  1569898   21.663    0.000   77.138    0.000 script.py:648(check_line)
  1569876   14.979    0.000   43.408    0.000 script.py:626(dict_add)
  4709757   23.865    0.000   23.865    0.000 {method 'strftime' of 'datetime.date' objects}
  1569899    1.943    0.000   15.556    0.000 script.py:592(reverse)
        1    0.000    0.000    9.078    9.078 script.py:1066(print_data)
        1    0.021    0.021    9.044    9.044 script.py:1005(print_ip)
       10    0.001    0.000    7.067    0.707 script.py:778(ip_api)

2 个答案:

答案 0 :(得分:1)

我假设current_date是一个字符串

首先,制作字典

BasicHttpBinding

然后,找到年/月/日等

moDict = {"Aug":8, "Jan":1} #etc

您可以使用它进行比较

答案 1 :(得分:1)

由于您的日期似乎是固定长度格式,因此很容易解析,您也不需要strptime来执行此操作。您可以将它们重新排列到ISO 8601 date/time format并直接将它们作为字符串进行比较!

mos = {'Jan': '01', 'Feb': '02', 'Mar': '03', 'Apr': '04', 'May': '05', 'Jun': '06', 'Jul': '07', 'Aug': '08', 'Sep': '09', 'Oct': '10', 'Nov': '11', 'Dec': '12'}

def custom_to_8601(dt):
    return dt[7:11] + '-' + mos[dt[3:6]] + '-' + dt[0:2] + 'T' + dt[12:]

>>> custom_to_8601('01/Aug/1995:23:59:53')
'1995-08-01T23:59:53'

使用join而不是字符串连接可能会更快,并省略标点符号:

def comparable_date(dt):
    return ''.join([dt[7:11], mos[dt[3:6]], dt[0:2], dt[12:]])

>>> comparable_date('01/Aug/1995:23:59:53')
'1995080123:59:53'

对我来说,在1000000次重复上运行cProfile会产生这些时间:

  • custom_to_8601:0.978秒
  • comparable_date:0.937秒
  • 原始代码strptime:15.492秒
  • 使用datetime构造函数的早期答案:1.134秒