鉴于以下数百个项目的numpy数组: [股票代码,货币,日期,汇率]
array([['AIndex', 'AUD', '2018-01-01', 1.28],
['BIndex', 'EUR', '2018-01-01', -0.248],
['CIndex', 'HKD', '2018-01-01', -1.18],
...,
['DIndex', 'JPY', '2018-04-06', -1.046],
['EIndex', 'EUR', '2018-04-06', 1.092],
['Findex', 'CAD', '2018-04-06', 0.61]], dtype=object)
我想找出哪两个代号(即AIndex,BIndex)具有最强的相关性,给出每个项目末尾的费率(例如:1.28)。
我想避免为每种类型的股票代码手动创建一个新数组,并且需要通过股票代码按日期来完成关联,忽略货币。
然后,我可以对相关系数进行评分,并使用此方法找到最强的相关系数: