我有一个日期列表,指示作业何时成功运行:列表可以是数百万个日期
YYYY-MM-DD HH:MM:SS
2016-01-01 05:00:00
2016-01-02 05:00:00
2016-01-05 13:00:00
2016-01-06 13:00:00
2016-01-09 05:00:00
2016-01-10 05:00:00
有时,作业可能会失败并将过程延迟几个小时到几天:
2016-01-13 14:00:00
2016-01-15 14:00:00
2016-01-19 06:00:00
2016-01-20 06:00:00
此列表显然是1天和3天。
我的问题是,如何找出任意日期列表的模式,能够忽略延迟,并估计作业将完成运行的下一个日期?
我需要估计并生成一个准确预测的日期,以便在下次完成作业时使用最多发生的日期,并尽可能忽略延迟。
任何帮助将不胜感激!