如何一次比较四列pandas数据帧?

时间:2016-09-19 12:46:49

标签: python pandas indexing dataframe conditional-statements

我有一个数据帧。

数据框:

   Symbol1   BB Symbol2 CC 
0         ABC    1  ABC       1
1         PQR    1  PQR       1
2         CPC    2  CPC       0
3         CPC    2  CPC       1
4         CPC    2  CPC       2

我想将Symbol1Symbol2BBCC进行比较,如果它们相同,那么我希望只有其他行必须从数据框中删除。

预期结果:

Symbol1   BB Symbol2 CC 
0         ABC    1  ABC       1
1         PQR    1  PQR       1
2         CPC    2  CPC       2

如果比较两行,那么我正在使用:

df = df[df['BB'] == '2'].copy()

它会正常工作。

df = df[df['BB'] == df['offset'] and df['Symbol1'] == df['Symbol2']].copy()

它给了我错误。

错误:

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

我如何比较并获得预期结果?

2 个答案:

答案 0 :(得分:6)

您可以使用boolean indexing并与&进行比较而不是and

print ((df.Symbol1 == df.Symbol2) & (df.BB == df.CC))
0     True
1     True
2    False
3    False
4     True
dtype: bool

print (df[(df.Symbol1 == df.Symbol2) & (df.BB == df.CC)])
  Symbol1  BB Symbol2  CC
0     ABC   1     ABC   1
1     PQR   1     PQR   1
4     CPC   2     CPC   2

答案 1 :(得分:3)

这是一种替代方式,它更好一点,但它也有点慢:

In [65]: df.query('Symbol1 == Symbol2 and BB == CC')
Out[65]:
  Symbol1  BB Symbol2  CC
0     ABC   1     ABC   1
1     PQR   1     PQR   1
4     CPC   2     CPC   2