我正在尝试从下表中找到每一行的各列之间的相关性:
nodes closeness degree actual_relays
238 0.622695 0.394077 0.0799
242 0.654735 0.472665 0.0791
247 0.653274 0.476082 0.0673
250 0.648928 0.458998 0.0689
254 0.705788 0.583144 0.1056
259 0.660647 0.486333 0.1125
我想要的是:
nodes corr values (for each row between the different columns)
238 corr_value1
242 corr_value2
247 corr_value3
250 corr_value4
254 corr_value5
259 corr_value6
...
corr_values
对应于每一行数据的相关性。使用df.corr()
或df.T.corr()
并不能达到预期的效果。有人可以建议这样做的方法吗?
例如,在这里我已绘制了贴近度和实际值之间的关系。有些接近度与实际值之间具有更强的关系,而有些则不具有相同的强度。如何找到每个节点的这种关系?
答案 0 :(得分:0)
我在这里寻找的基本上是每个节点对所呈现数据的相关性的影响。为此,我需要遵循查找相关性的步骤,例如可以找到here。但是在对标准值乘积的值求和之前,我使用unity-based normalization来查找每个节点如何分别对这两个数据的总相关性做出贡献。