我有一个数据帧。
数据框:
Symbol1 BB Symbol2 CC
0 ABC 1 ABC 1
1 PQR 1 PQR 1
2 CPC 2 CPC 0
3 CPC 2 CPC 1
4 CPC 2 CPC 2
我想将Symbol1
与Symbol2
和BB
与CC
进行比较,如果它们相同,那么我希望只有其他行必须从数据框中删除。
预期结果:
Symbol1 BB Symbol2 CC
0 ABC 1 ABC 1
1 PQR 1 PQR 1
2 CPC 2 CPC 2
如果比较两行,那么我正在使用:
df = df[df['BB'] == '2'].copy()
它会正常工作。
df = df[df['BB'] == df['offset'] and df['Symbol1'] == df['Symbol2']].copy()
它给了我错误。
错误:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
我如何比较并获得预期结果?
答案 0 :(得分:6)
您可以使用boolean indexing
并与&
进行比较而不是and
:
print ((df.Symbol1 == df.Symbol2) & (df.BB == df.CC))
0 True
1 True
2 False
3 False
4 True
dtype: bool
print (df[(df.Symbol1 == df.Symbol2) & (df.BB == df.CC)])
Symbol1 BB Symbol2 CC
0 ABC 1 ABC 1
1 PQR 1 PQR 1
4 CPC 2 CPC 2
答案 1 :(得分:3)
这是一种替代方式,它更好一点,但它也有点慢:
In [65]: df.query('Symbol1 == Symbol2 and BB == CC')
Out[65]:
Symbol1 BB Symbol2 CC
0 ABC 1 ABC 1
1 PQR 1 PQR 1
4 CPC 2 CPC 2