我有一个包含24个变量(列)和1000行的数据。列代表 AGE,SALARY,REGION,GENDER 等。
我需要找到每列之间的相关性,(AGE,SALARY),(年龄,地区)(年龄,性别)等。我需要gdet 23 * 24 = 552相关性。有没有办法制作一个循环或什么,并立即获得所有这些相关性,而不是单独找到552次? 请帮忙!我不能做552次。一定有办法!
更新:我认为COR<-cor(mytest[sapply(mytest,is.numeric)])
我得到了我想要的东西
我有点像
AGE SALARY REGION
AGE 1 NA 0.25
SALARY NA 1
REGION 0.25 NA 1
等。但现在问题是它给了我不需要的NA。我试过这个
> COR<-cor(mytest[sapply(mytest,is.numeric)],use="complete.obs")
但不幸的是它不起作用,给我错误&#34;没有完整的元素对&#34;。我怎么做? 提前致谢
答案 0 :(得分:2)
我想你想要一个相关矩阵,试试这个:
cor(yourdataframe)
编辑:
我想我误解了,如果你想将Age与其他所有专栏联系起来,请试试这个:
apply(yourdataframe, 2, cor, x = AGE)
答案 1 :(得分:0)