如何通过在python中使用Z分数来计算相关性?

时间:2019-08-19 04:36:53

标签: python pandas statistics

我在pandas数据框中有类似于下表的数据:

  Z(A) Z(B) Z(TARGET)
1  0.4 0.17   0.96
2  0.2 0.37   0.45
3  0.1 -0.4   1.1
...

因此,是否可以仅使用z得分(最好是使用熊猫库)来计算ABTARGET的相关性?

我知道pandas库在其corr类中有方法DataFrame,在这里我还看到了其他有关使用该方法的问题。但是这些问题中的数据是原始数据(即ABTARGET),而我只有z个分数的数据(即Z(A),{{1} },Z(B))。 是否可以将Z(TARGET)函数应用于我的Z表,还是需要使用其他方法来计算corrATARGETB的相关性方法?

我知道这个问题更多的是数学问题,而不是编程问题,因此,抱歉,如果我将其张贴在错误的位置。但这与两者都有关系。

1 个答案:

答案 0 :(得分:0)

您不能在这里使用corr,至少不能单独使用。可以通过此公式http://davidmlane.com/hyperstat/A51911.html从z分数获得Pearson相关性。我将编写一个函数进行求和,然后使用for循环和df.iloc []遍历数据帧。它可能足够快,只是不够漂亮。