我正在做一个独立的项目,我试图研究一个国家的经济状况与流行音乐之间是否存在关联。因此,我有两个数据集-一个数据集是1958年至2018年美国GDP的年增长率,以及1958年至2018年广告牌排名前100位音乐的年均“价”。(价来自Spotify API,使用节奏,响度等)
我面临的许多问题之一是两个数据集的值范围非常不同。 GDP增长率的最小值为-2.5,最大值为7.2,标准偏差为2.11,而化合价的最小值为0.43,最大值为0.47,标准差为0.009。我想以某种方式缩放其中一个或两个数据,以便彼此比较,但担心标准化可能会掩盖信号的很大一部分。
重新缩放数据集是否存在经验法则,以便更好地相互比较?