计算R中具有不同长度的列之间的相关性

时间:2018-04-03 15:20:54

标签: r loops correlation

我有一个包含14列的数据框,我想计算这些列之间的相关性。但是,有些列中有NA。最初,我使用na.omit(a)从数据帧中删除NA,然后使用cor来计算相关性,但是由于5列主要是NA,所以做na.omit删除了我的大部分观察结果。

目前,我正在尝试使用For循环单独选择一个列,使用na.omit,计算相关性,并将值放入数组中。我将为所有变量重复此过程。下面是数据示例和我的代码示例。

head(selected_data)

final initial qualitative quantitative Revenue
 NA     1        2           11           2 
  1    NA        4           3           NA 
 NA    NA        8           NA          NA 
 8     7         9           6            3

a=na.omit(selected_data$final)
b=na.omit(selected_data$initial)
c=na.omit(selected_data$qualitative)
d=na.omit(selected_data$quantitative)
e=na.omit(selected_data$Revenue)


      col_name =c('a', 'b' ,'c', 'd', 'e')
   i="a"
   j="a"
   for (i in col_name) {
       for (j in col_name) {
          Rating_array<-cor(i,j)
  }
}

不幸的是,循环不起作用。我是R的新手,我对更好的方法持开放态度。如果有任何帮助,我将不胜感激。

0 个答案:

没有答案