将许多时间戳与熊猫进行比较

时间:2019-09-26 09:08:13

标签: python pandas

我有两个具有不同大小的数据框,其中包含时间戳。我需要找到最近的时间戳。在df A中,我需要找到df B的任何时间戳之后的所有第一个时间戳。数据帧每个都有100,000行,因此迭代不是一种方法,甚至df.apply()也花费了大约6分钟。

例如:

A:
11
12
15
16
18
20
25
30
50

B:
14
19
22
27

result:
15
20
25
30

1 个答案:

答案 0 :(得分:2)

使用Series.searchsorted

out = a.loc[a['A'].searchsorted(b['B']), 'A']
print (out)
2    15
5    20
6    25
7    30
Name: A, dtype: int64