在Python / Pandas / Excel中为每个ID查找2个不同表的重叠日期

时间:2019-11-13 06:20:45

标签: python excel pandas

2个表的每个ID都有多个日期范围,ID总数约为40k。

期望每个表中的每个ID日期范围都不会重叠,但是会在两个表之间发生重叠:在此示例中,有2个不同的ID,表1和表2之间的日期范围之间存在n个重叠。因此我需要在整个数据框中查找表1中的记录与表2中每个ID的日期重叠。

表1

table1

表2

l

1 个答案:

答案 0 :(得分:1)

import numpy as np
import pandas as pd

T1 = pd.read_excel('Table1.xslx')
T2 = pd.read_excel('Table2.xslx')

df = pd.merge(T1, T2, how='inner')
print(df)

合并2个数据框会在它们之间产生交集。