我的表具有不同的日期时间格式。给定两个表,目标是识别粒度更宽松的格式。该功能将识别最小粒度的表,并输出该表和粒度级别。
类似这样的东西:
def smallest_granularity(s1, s2):
...
return ("seconds" or "minutes" or "hours" or "days" or "months"), s2
例如
t1
datetime | v1
2014-01-01| 3
2015-02-01| 4
2011-11-11| 2
t2
datetime | v2
2010-01-07 01:00:00| 3
2008-01-11 03:20:20| 4
2019-03-03 01:04:20| 2
由于"day", t1"
只能区分日期,因此输出为t1
。
对于
t1
datetime | v1
2014-01-01 01:00| 3
2015-02-01 05:00| 4
2011-11-11 02:35| 2
t2
datetime | v2
2010-01-07 01:00:00| 3
2008-01-11 03:20:20| 4
2019-03-03 01:04:20| 2
此处的输出为"minutes", t1"
,因为t1
最多只能区分一分钟。
是否有任何整洁的方法可以进行肮脏的解析?