解析包含纳秒的日期时间字符串

时间:2012-05-16 02:40:16

标签: python datetime strptime time-precision

我有一些时间格式为HH:MM :: SS.nano_seconds(例如01:02:03.123456789)的日志文件。我想在python中创建一个日期时间,这样我就可以在时间上巧妙地进行数学运算(例如,采取时间差异)。 strptime使用%f适用于微秒。 Python日期时间和时间模块真的不支持纳秒吗?

5 个答案:

答案 0 :(得分:17)

您可以看到from the source日期时间对象不支持比微秒更精细的任何内容。正如Mike Pennington在评论中指出的那样,这是因为actual hardware clocks aren't nearly that precise。维基百科说HPET的频率“至少为10 MHz”,这意味着每100纳秒就有一个滴答。

如果你可以抛出最后三位数(这可能不太有意义),你可以解析这个,只需将输入字符串切成小数点后只有六位数并用{{1解析}}。否则,您似乎必须自己实施减法。

答案 1 :(得分:3)

如果您实际上并不关心纳秒,但您仍然希望能够解析秒数中超过 6 位小数的日期时间,您可以使用 python-dateutils 库。

例如,尝试使用标准 lib datetime 包:

#include <iostream>
#include <vector>

using namespace std;

vector<int> x = {2, 3, 4};

void func() {
    vector<int> y = {1, 2, 3};
    cout << "y before: " << &y << endl;
    x.swap(y);
    cout << "y after: " << &y << endl;
}

int main()
{
    cout << "x before: " << &x << endl;
    func();
    cout << "x after: " << &x << endl;
    return 0;
}

但是使用 python-dateutils,它实际上解析它而不会抛出错误:

>>> from datetime import datetime
>>> datetime.strptime('2021-02-14T02:27:57.96119078Z', '%Y-%m-%dT%H:%M:%S.%fZ')
ValueError: time data '2021-02-14T02:27:57.96119078Z' does not match format '%Y-%m-%dT%H:%M:%S.%fZ'

请注意,它不会保留纳秒(也不会正确舍入 - 它只是在小数点后 6 位后被截断),但至少不会破坏 > 6 位小数的解析。

答案 2 :(得分:2)

这是旧线程,但仍然...

您可以使用Pandas功能来实现此目的。我有类似'2019-03-22T14:00:01.700311864Z'的时间戳,我通过以下方式将其转换为时间戳:

    firstStamp = pd.to_datetime(firstStampString, format='%Y-%m-%dT%H:%M:%S.%fZ')
    lastStamp = pd.to_datetime(lastStampString, format='%Y-%m-%dT%H:%M:%S.%fZ')

    deltaTime = lastStamp - firstStamp

这很好。

答案 3 :(得分:1)

您可以很自然地使用numpy使用纳秒级甚至更精确的时间单位(ps,fs,as)。 Numpy有自己的Datetimes and Timedeltas实现,因此您可以尝试np.datetime64

import numpy as np
def str_to_ns(time_str):
     """
     input: time in a format `hh:mm:ss.up_to_9_digits`
     """
     h, m, s = time_str.split(":")
     int_s, ns = s.split(".")
     ns = map(lambda t, unit: np.timedelta64(t, unit),
              [h,m,int_s,ns.ljust(9, '0')],['h','m','s','ns'])
     return sum(ns)

然后您可以通过以下方式使用此功能:

>>> src = "1:2:34.123456789"
>>> out = str_to_ns(src)
>>> print(out)
3754123456789 nanoseconds
>>> out / np.timedelta64(1,'h')
1.0428120713302778
>>> out / np.timedelta64(1,'m')
62.568724279816664
>>> out / np.timedelta64(1,'s')
3754.123456789

算术也是可能的:

>>> t1, t2 = str_to_ns("1:0:12.12345678"), str_to_ns("1:0:12.12")
>>> t1 - t2
numpy.timedelta64(3456780,'ns')

我同意这不是 自然的方法,但是通过这种方式,您仅需numpy就可以实现任意的高时间精度。

答案 4 :(得分:1)

def parse_nanodate(s):
  """
  parse date, ignore nanoseconds
  sample input: 2020-12-31T16:20:00.000000123Z
  --> 123ns will be ignored
  """
  if s[-1] == 'Z':
    # add explicit UTC timezone, to make strptime happy
    s += '+0000'
  return datetime.datetime.strptime(
    s[0:26]+s[29:], '%Y-%m-%dT%H:%M:%S.%fZ%z')