熊猫数据帧中每一行的相关性

时间:2019-06-21 23:38:38

标签: python pandas relationship correlation

我正在尝试从下表中找到每一行的各列之间的相关性:

nodes   closeness   degree      actual_relays
238     0.622695    0.394077    0.0799
242     0.654735    0.472665    0.0791
247     0.653274    0.476082    0.0673
250     0.648928    0.458998    0.0689
254     0.705788    0.583144    0.1056
259     0.660647    0.486333    0.1125

我想要的是:

nodes   corr values (for each row between the different columns)    
238     corr_value1 
242     corr_value2 
247     corr_value3     
250     corr_value4     
254     corr_value5 
259     corr_value6 
... 

corr_values对应于每一行数据的相关性。使用df.corr()df.T.corr()并不能达到预期的效果。有人可以建议这样做的方法吗?

For example here I have plotted the closeness and actual values against each other. Some have a stronger relationship between their closeness and actual values, while some don't have the same strength. How do I find this relationship for each node?

例如,在这里我已绘制了贴近度和实际值之间的关系。有些接近度与实际值之间具有更强的关系,而有些则不具有相同的强度。如何找到每个节点的这种关系?

1 个答案:

答案 0 :(得分:0)

我在这里寻找的基本上是每个节点对所呈现数据的相关性的影响。为此,我需要遵循查找相关性的步骤,例如可以找到here。但是在对标准值乘积的值求和之前,我使用unity-based normalization来查找每个节点如何分别对这两个数据的总相关性做出贡献。