熊猫isin多列似乎不匹配?

时间:2017-06-13 15:47:31

标签: python pandas numpy

我有一个类似于:

的数据框(eval_datan)
    ccs1    ccs2    ccs3    ccs4    ccs5    ccsp1   ccsp2   ccsp3   ccsp4   ccsp5   
0   101     164     53      98      200     102     100     256     259     133 
1   204     120     147     258     151     47      256     259     48 
49  
2   197     2       39      253     259     259     49      98      256     257 
3   198     258     126     127     128     133     128     256     134     92  
4   204     211     232     244     95      259     256     257     98  
254 

我试图确定ccs5是否在任何ccsp1-ccsp5中

我的代码是:

eval_datan['correct']=(eval_datan['ccs5'].isin (eval_datan[['ccsp1','ccsp2','ccsp3','ccsp4','ccsp5']]))

我得到所有的错误第2行应该说是真实的ccs5 = 259和ccsp1在第一时我认为它可能是不同的数字类型但是我将ccsp列重新设置为来自int64的uint16,因为numpy最初生成的是没有帮助。 ccs5列是uint16。

1 个答案:

答案 0 :(得分:3)

eval_datan['correct'] = eval_datan[['ccsp1','ccsp2','ccsp3','ccsp4','ccsp5']].isin(eval_datan['ccs5']).any(axis=1)

输出:

   ccs1  ccs2  ccs3  ccs4  ccs5  ccsp1  ccsp2  ccsp3  ccsp4  ccsp5  correct
0   101   164    53    98   200    102    100    256    259    133    False
1   204   120   147   258   151     47    256    259     48     49    False
2   197     2    39   253   259    259     49     98    256    257     True
3   198   258   126   127   128    133    128    256    134     92     True
4   204   211   232   244    95    259    256    257     98    254    False