Python:将整数转换为数据时间戳记

时间:2018-09-12 10:40:59

标签: python pandas datetime timestamp time-series

我发现很难转换以下列表l

l = [0, 1]

插入与以下数据帧df的索引对应的时间戳:

                 dt  val
2017-11-13 00:00:00  8
2017-11-13 01:00:00  17

理想情况下,结果必须是:

l = [2017-11-13 00:00:00, 2017-11-13 01:00:00]

所以我可以在与df重叠的较长时间序列的图中识别出这两个时间步长。

做到这一点的最佳方法是什么?我的尝试失败了,我无法理解正确的时间戳格式:

index1 = pd.to_datetime(str(df.index[l[0]]), format='%Y-%m-%d %H:%M:%S')
index2 = pd.to_datetime(str(df.index[l[1]]), format='%Y-%m-%d %H:%M:%S')

这会引发错误:

ValueError: time data '2017-11-13 00:00:00' does not match format '%Y-%m-%d %H:%M:%S' (match)

2 个答案:

答案 0 :(得分:1)

我认为需要使用f字符串来理解列表:

d = pd.to_datetime([f'2017-11-13 {x}:00:00' for x in l], format='%Y-%m-%d %H')
print(d)

DatetimeIndex(['2017-11-13 00:00:00', '2017-11-13 01:00:00'], 
              dtype='datetime64[ns]', freq=None)

性能(取决于实际数据):

np.random.seed(2018)
l = np.random.randint(12, size=1000).tolist()

In [48]: %%timeit
    ...: d = pd.to_datetime([f'2017-11-13 {x}:00:00' for x in l], format='%Y-%m-%d %H')
647 µs ± 2.45 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [49]: %%timeit
    ...: d = pd.to_datetime('2017-11-13' + 
             pd.Index(l).astype(str).str.zfill(2), format='%Y-%m-%d%H')
    ...: 
4.43 ms ± 22 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

答案 1 :(得分:1)

有几种方法,但这是一种没有显式循环或不指定格式的方法:

L = [0, 1]

datetime = pd.to_datetime('2017-11-13') + pd.to_timedelta(L, unit='h')

结果:

DatetimeIndex(['2017-11-13 00:00:00', '2017-11-13 01:00:00'], 
              type='datetime64[ns]', freq=None)

您的解决方案将无法正常工作,因为str不能以矢量方式工作。