我正在尝试计算我的数据框的相关性,即df3,看起来像这样
group a b
1 01_01-102_PRT 0.5857299 1.0915944
2 01_1014_EMH -0.8875033 0.9982261
3 02_02-012_ABT 1.5402289 1.0095046
4 02_02-028B_TMA -0.2635421 0.9533909
5 02_097A_KMG 0.1529145 1.0452099
6 02_116_DMC 0.7375643 0.9927591
我的代码:
require(plyr)
func <- function(df3)
{
return(data.frame(COR = cor(df3$a, df3$b)))
}
too <- ddply(df3, .(group), func)
我的输出
group COR
1 01_01-102_PRT NA
2 01_1014_EMH NA
3 02_02-012_ABT NA
4 02_02-028B_TMA NA
5 02_097A_KMG NA
....
我也尝试了其他方式https://stats.stackexchange.com/questions/4040/r-compute-correlation-by-group,但我总是得到NAs。
请帮助
由于
杰森
答案 0 :(得分:0)
看起来每个组只包含一行,因此只有一个a
和一个b
值。如果数据没有变化,则无法计算相关性。因此,a
和b
至少需要两个不同的值。