如何在pandas数据帧中检查一列与另一列的依赖关系

时间:2017-08-17 00:25:39

标签: pandas dataframe

我有以下数据框:

 import pandas as pd

 df=pd.DataFrame([[1,11,'a'],[1,12,'a'],[1,11,'a'],[1,12,'a'],[1,7,'a'],
                [1,12,'a']])
 df.columns=['id','code','name']

 df

    id  code name
0   1    11    a
1   1    12    a
2   1    11    a
3   1    12    a
4   1     7    a
5   1    12    a

如上面的数据框所示,列" id"的值列与#34; name"的值直接相关。如果我说一百万条记录,我怎么知道一列完全依赖于数据帧中的其他列呢?

1 个答案:

答案 0 :(得分:5)

如果他们完全依赖,那么他们的因素将是相同的

(df.id.factorize()[0] == df.name.factorize()[0]).all()

True