Question

我在pandas数据框中有类似于下表的数据：

  Z(A) Z(B) Z(TARGET)
1  0.4 0.17   0.96
2  0.2 0.37   0.45
3  0.1 -0.4   1.1
...

因此，是否可以仅使用z得分（最好是使用熊猫库）来计算A和B与TARGET的相关性？

我知道pandas库在其corr类中有方法DataFrame，在这里我还看到了其他有关使用该方法的问题。但是这些问题中的数据是原始数据（即A，B，TARGET），而我只有z个分数的数据（即Z(A)，{{1} }，Z(B)）。是否可以将Z(TARGET)函数应用于我的Z表，还是需要使用其他方法来计算corr与A和TARGET与B的相关性方法？

我知道这个问题更多的是数学问题，而不是编程问题，因此，抱歉，如果我将其张贴在错误的位置。但这与两者都有关系。

Answer 1

您不能在这里使用corr，至少不能单独使用。可以通过此公式http://davidmlane.com/hyperstat/A51911.html从z分数获得Pearson相关性。我将编写一个函数进行求和，然后使用for循环和df.iloc []遍历数据帧。它可能足够快，只是不够漂亮。

如何通过在python中使用Z分数来计算相关性？

1 个答案: