熊猫数据框检查时间戳的最佳方法

时间:2019-03-04 14:58:51

标签: python pandas

我有一个带有很多时间戳的熊猫数据框:

|     |         ti_ms |
|-----+---------------+
|   0 | 1551398400000 |
|   1 | 1551398700000 |
|   2 | 1551399000000 |
|   3 | 1551399300000 |
|   4 | 1551399600000 |
|   5 | 1551399900000 |
|   6 | 1551400200000 |
|   7 | 1551400500000 |
|   8 | 1551400800000 |

间隔始终为3000毫秒(5分钟)。 我要检查是否存在间隙,这意味着间隔有时是否大于3000毫秒。

我会这样解决:

使用以下两行之间的增量创建新列:

df['delta'] = df['ti_ms'] - df['ti_ms'].shift(1)

然后检查是否存在df ['delta']!= 3000(第一行除外)->如果一切都还好,那么

在我看来,这还不够优雅。是否有更好的方法来寻找时间戳之间的差距?

1 个答案:

答案 0 :(得分:1)

df.diff()应该可以。您可以定义的行的axis = 0,列的axis = 1。 有关更多参考,请检查Pandas documentation