访问R

时间:2019-05-16 16:05:10

标签: r dataframe correlation

我想获取一个变量与数据集中所有其他变量的相关性。为此,我尝试了以下操作:

library(data.table)
df <- fread(
    "A   B   D  E  iso   year   
     1   A   1  NA ECU   2009   
     2   B   2  0  ECU   2009   
     3   D   3  0  BRA   2011   
     4   E   4  0  BRA   2011   
     5   D   7  NA ECU   2008   
     6   E   1  0  ECU   2008   
     7   A   3  2  BRA   2012   
     8   A   4  NA BRA   2012",
  header = TRUE
)

numcols <- which(sapply(df, is.numeric))

dfcor <- df[, x := .(list(cor(.SD, use= "pairwise.complete.obs", method= "pearson"))), by = iso, .SDcols = numcols]

但这在x中创建了列dfcor,其本身就是df /矩阵。

例如:

dfcor[2,7]

给予:

              A          D  E       year
A     1.0000000  0.3656362 NA -0.9701425
D     0.3656362  1.0000000 NA -0.5025189
E            NA         NA NA         NA
year -0.9701425 -0.5025189 NA  1.0000000

由于我只想与A相关,所以我只需要第一行(或列)。如何访问这些行或列?

0 个答案:

没有答案