python中2个数据帧的成对相关

时间:2017-05-22 10:59:03

标签: python pandas dataframe scipy

我有2个数据帧:

df = pd.DataFrame({'SAMs': ['GOS', 'BUM', 'BEN', 'AUD', 'VWA','HON'], 
    'GN1': [22, 22, 2, 2, 2,5], 
    'GN2':[1.1,5.7,4.8,7.09,10.876,0.178]})
df



    GN1 GN2 SAMs
0   22  1.100   GOS
1   22  5.700   BUM
2   2   4.800   BEN
3   2   7.090   AUD
4   2   10.876  VWA
5   5   0.178   HON

和df2:

df2 = pd.DataFrame({'SAMs': ['FAMS', 'SAP', 'KLM', 'SOS', 'LUD','EJT'], 
    'GN1': [22, 22, 2, 2, 2,5], 
    'GN2':[1.1,5.7,4.8,7.09,10.876,0.178]})

我需要计算来自df1和df2的列SAM之间的皮尔逊相关性。对于来自df1和df2的SAM列中的每个值,我希望进行成对组合并计算它们的相关性。

最后,输出应如下所示:

SAMs    correlation_value P-value
GOS-FAMS   0.45             0.87
GOS-SAP    0.55             1
GOS-KLM     0.15            0.89
...
HON-EJT     0.156            0.98

任何建议都会很棒!

0 个答案:

没有答案