查找数据框中两列的交集

时间:2019-07-23 07:14:41

标签: python dataframe machine-learning

我有一个包含两列的数据集,一列具有区域名称,一列具有时间。我发现了最频繁出现的区域名称和时间。 现在,我希望找到这两次一起发生的次数,因为我在同一行中有一个频繁出现的名称和一个频繁出现的时间。

我尝试了一下,但是没用:

a = (3,1,93,34,29) #topmost frequntly occurring areas 
b = (8,9,17,18,7) #topmost frequently occurring timings (in 24 hr)

def update(df):
    for i in range(0,len(df)):
        if df.iloc[i,0] == any(a):
           if df.iloc[i,9] == any(b):
              arr1.append(df.iloc[i,:])

update(df)

它只是给出一个空数组:

在[40]中:arr1 出[40]:[]

1 个答案:

答案 0 :(得分:0)

解决此问题的一种方法是仅提取包含最频繁出现区域的行,然后从该数据子集中仅选择包含最频繁出现时间的行。