使用具有大量NA的大数据时的相关循环

时间:2015-04-14 03:48:26

标签: r loops correlation na

您好我是R的新手并且还没有获得那么多经验,但是在这里得到了很多帮助。我有一个非常大的数据框,对601个变量进行了185次观察。框架没有标签。 当与列号601相关时,我需要获得列号1:600的相关系数。

以下是如何为列的前6个观测值安排数据的示例

NA               NA
NA               NA
NA               2.00E-01
4.27E-01         7.10E-01
7.64E-0          1.58E+00
1.06E+           NA

我将数据加载为没有标题的表

sr3coco <- read.table("sr3all2.txt", header=F)

然后为我需要

的相关变量创建一个x和y
x=sr3coco[,601]

这很好,并且作为数字向量出现,因为没有NA&#39;但当我做y时

y=sr3coco[,1:600]

它出现了一个列表向量,我认为这是因为我所有的NA所以正在进行,所以当我尝试进行相关循环时

corr.values <- vector("list", 600)
  for (i in 1:length(y) ) {
  cor.values[[i]] <- cor.test(x, y [[i]], method="s")
}

出现错误

  

&#39; cor.test.default(x,y [[i]],method =&#34; s&#34;)出错:     &#39; Y&#39;必须是数字向量&#39;

我已经尝试了很多方法来尝试阻止y出现作为列表因素,但我似乎无法弄明白。我曾尝试将数据框转换为数字矩阵,但仍然没有将y更改为数字向量。

0 个答案:

没有答案