我在pandas数据框中有类似于下表的数据:
Z(A) Z(B) Z(TARGET)
1 0.4 0.17 0.96
2 0.2 0.37 0.45
3 0.1 -0.4 1.1
...
因此,是否可以仅使用z得分(最好是使用熊猫库)来计算A
和B
与TARGET
的相关性?
我知道pandas库在其corr
类中有方法DataFrame
,在这里我还看到了其他有关使用该方法的问题。但是这些问题中的数据是原始数据(即A
,B
,TARGET
),而我只有z个分数的数据(即Z(A)
,{{1} },Z(B)
)。
是否可以将Z(TARGET)
函数应用于我的Z表,还是需要使用其他方法来计算corr
与A
和TARGET
与B
的相关性方法?
我知道这个问题更多的是数学问题,而不是编程问题,因此,抱歉,如果我将其张贴在错误的位置。但这与两者都有关系。
答案 0 :(得分:0)
您不能在这里使用corr,至少不能单独使用。可以通过此公式http://davidmlane.com/hyperstat/A51911.html从z分数获得Pearson相关性。我将编写一个函数进行求和,然后使用for循环和df.iloc []遍历数据帧。它可能足够快,只是不够漂亮。