我有2个变量的大约9k观测值,我想测试它们的相关性。我最初是通过值对其进行子集化,我没有遇到任何问题。我意识到由于观察次数较少,我不会在某些价值组中获得统计上显着的相关性。我决定改变我的分组方法。我现在可以毫无困难地将前X%分配,但是很难弄清楚如何将所有数据分组到多个百分位数,即0-5%,5-10%,10-15%。非常感谢。谢谢,Jono
答案 0 :(得分:1)
我们可以在cut2
包
Hmisc
功能
library(Hmisc)
cut2(x, g=20)
您可以根据需要将数据分为20个分位数