pandas数据框检查列

时间:2015-03-06 01:14:17

标签: pandas dataframe

在pandas dataframe df中

Col1    Col2    Col3

T1      N1      G1

T2      N2      G1

T3      N3      G1

T4      M1      G2

T5      M2      G2

T6      M3      G2

我怀疑G1,N1 = N2 = N3和G2,M1 = M2 = M3等等,我想检查一下。你能建议我怎么检查它

2 个答案:

答案 0 :(得分:0)

您可以致电groupbynunique

>>> df
  Col1  Col2 Col3
0   T1     1   G1
1   T2     1   G1
2   T3     2   G1
3   T4     5   G2
4   T5     5   G2
5   T6     5   G2
>>> df.groupby("Col3")["Col2"].nunique()
Col3
G1      2
G2      1
Name: Col2, dtype: int64

这包含每个Col2值的唯一Col3值的数量。如果你想检查它们是否全部直接:

>>> (df.groupby("Col3")["Col2"].nunique() == 1).all()
False

答案 1 :(得分:0)

更简单的手动方式是:

for row in df.iterrows():
     print row[1][1] == row[1][2]

这样可以直观地检查列是否匹配。