我想优化以下代码....(检查数据框中的一对元素是否存在于另一个数据框中)

时间:2017-03-24 09:34:32

标签: python pandas

for j in range (0,len(fin1)): 

    for t in range (0,len(data1):

        if fin1.ix[j,0] in (data1.ix[t:t]).values and fin1.ix[j,1] in (data1.ix[t:t]).values:

            fin1['count'][j]+=1

- >这是名为'fin1'的数据框,包含一行中的两个值,我希望计算所有这些行的集合在另一个数据框中出现的次数

   0    H1  I1
   1    H1  M1
   2    H1  AD1
   3    H1  AE1
   4    H1  AF1
   5    H1  AQ1
   6    I1  M1
   7    I1  X1
   8    I1  Z1
   9    I1  AA1
  10    I1  AB1
   ...  ... ...

- >这是另一个数据框'data1'

   0    B1  C1  D1  E1  F1  G1  H1  I1  J1  K1  ... AZ1 BA1 BB1 BC1 BD1 BE1 BF0 BG1 BH0 BI1

   1    B1  C1  D1  E1  F1  G1  H1  I1  J1  K1  ... AZ1 BA1 BB1 BC1 BD1 BE1 BF1 BG1 BH1 BI1

   2    B1  C1  D0  E1  F1  G1  H1  I1  J1  K0  ... AZ1 BA0 BB1 BC0 BD1 BE1 BF1 BG1 BH0 BI1

   3    B1  C1  D1  E1  F0  G1  H1  I0  J1  K1  ... AZ1 BA0 BB0 BC1 BD1 BE0 BF1 BG1 BH1 BI1

我写的代码运行速度很慢,我知道有更好的方法可以做到这一点,请帮帮我.... 提前谢谢..

0 个答案:

没有答案