这可能是一个简单的问题,但我仍然是r的初学者。
我需要计算数据框中三列的每两个数值变量之间的相关系数并绘制它们。
我希望在第2列和第2列之间3,第2列和第2列4,最后在第3列和第3列之间4.
提前多多感谢。
答案 0 :(得分:1)
您可以使用以下代码:我重新创建数据集的前3行并将它们放在名为“mydata”的数据框中
cname <- c("Albania", "Argentina", "Australia")
economic_growth_rate <- c(75.67, 6.87, 24.22)
ave_HDI_rate <- c(8.69, 7.03, 3.61 )
ave_raw_EPI_growth_percentage <- c(16.61, -12.39, -1.77)
mydata <- data.frame(cname, economic_growth_rate, ave_HDI_rate, ave_raw_EPI_growth_percentage)
cor(mydata[ , 2:4])
这会产生相关矩阵。
上面代码中的最后一行从数据集mydata中选择第2列最多4列,并将其传递给函数cor。
你可以像这样呈现一个条形图:
cordf <- cor(mydata[ , 2:4])
barplot(cordf[,1])
在控制台中输入以获取更多信息:
?cor
?barplot
或者您可以查看包corrgram和corrplot