从现有的numpy数组中导出许多数组来计算相关系数

时间:2018-04-08 17:28:40

标签: python numpy matrix

鉴于以下数百个项目的numpy数组: [股票代码,货币,日期,汇率]

array([['AIndex', 'AUD', '2018-01-01', 1.28],
       ['BIndex', 'EUR', '2018-01-01', -0.248],
       ['CIndex', 'HKD', '2018-01-01', -1.18],
       ...,
       ['DIndex', 'JPY', '2018-04-06', -1.046],
       ['EIndex', 'EUR', '2018-04-06', 1.092],
       ['Findex', 'CAD', '2018-04-06', 0.61]], dtype=object)

我想找出哪两个代号(即AIndex,BIndex)具有最强的相关性,给出每个项目末尾的费率(例如:1.28)。

我想避免为每种类型的股票代码手动创建一个新数组,并且需要通过股票代码按日期来完成关联,忽略货币。

然后,我可以对相关系数进行评分,并使用此方法找到最强的相关系数:

How do you calculate correlation between all columns in a DataFrame and all columns in another DataFrame?

0 个答案:

没有答案