在pandas dataframe df中
Col1 Col2 Col3
T1 N1 G1
T2 N2 G1
T3 N3 G1
T4 M1 G2
T5 M2 G2
T6 M3 G2
我怀疑G1,N1 = N2 = N3和G2,M1 = M2 = M3等等,我想检查一下。你能建议我怎么检查它
答案 0 :(得分:0)
您可以致电groupby
和nunique
:
>>> df
Col1 Col2 Col3
0 T1 1 G1
1 T2 1 G1
2 T3 2 G1
3 T4 5 G2
4 T5 5 G2
5 T6 5 G2
>>> df.groupby("Col3")["Col2"].nunique()
Col3
G1 2
G2 1
Name: Col2, dtype: int64
这包含每个Col2
值的唯一Col3
值的数量。如果你想检查它们是否全部直接:
>>> (df.groupby("Col3")["Col2"].nunique() == 1).all()
False
答案 1 :(得分:0)
更简单的手动方式是:
for row in df.iterrows():
print row[1][1] == row[1][2]
这样可以直观地检查列是否匹配。