我有两个具有不同大小的数据框,其中包含时间戳。我需要找到最近的时间戳。在df A中,我需要找到df B的任何时间戳之后的所有第一个时间戳。数据帧每个都有100,000行,因此迭代不是一种方法,甚至df.apply()
也花费了大约6分钟。
例如:
A:
11
12
15
16
18
20
25
30
50
B:
14
19
22
27
result:
15
20
25
30
答案 0 :(得分:2)
out = a.loc[a['A'].searchsorted(b['B']), 'A']
print (out)
2 15
5 20
6 25
7 30
Name: A, dtype: int64