直方图和5个变量的相关性

时间:2016-01-19 22:09:49

标签: r histogram correlation

我是R的新手,我制作了一些包含小数据集的图表。现在我想在数据集中绘制(直方图和相关性)9个变量和107个观测值。

它是关于肺癌导致每100,000人死亡的原因。我有五列,每100,000人死亡人数,一个年龄范围(0-14岁,15-44岁,45-54岁,55-64岁,65岁以上)。在行中有国家的州。我这样做没有成功:

hist(PULMON.R$X0.14.años, PULMON.R$X15.44.años, PULMON.R$X45.54.años, PULMON.R$X55.64.años, PULMON.R$X65.Y.MAS.años)
Error in hist.default(PULMON.R$X0.14.años, PULMON.R$X15.44.años, PULMON.R$X45.54.años,  : 
  'probability' is an alias for '!freq', however they differ.

我得到了一个奇怪的图形,其中X轴上有几个数字:

barplot(PULMON.R$X0.14.años, PULMON.R$X15.44.años, PULMON.R$X45.54.años, PULMON.R$X55.64.años, PULMON.R$X65.Y.MAS.años)

对于相关性,我什么都没得到。我想看看年龄(变老)与更多死亡病例之间是否存在关联。我这样做了:

cor(PULMON.R$X0.14.años, PULMON.R$X15.44.años, PULMON.R$X45.54.años, PULMON.R$X55.64.años, PULMON.R$X65.Y.MAS.años)
Error in cor(PULMON.R$X0.14.años, PULMON.R$X15.44.años, PULMON.R$X45.54.años,  : 
  unused argument (PULMON.R$X65.Y.MAS.años)

我的数据集是PULMON.R Pulmon意味着西班牙语的肺。

1 个答案:

答案 0 :(得分:1)

这些功能不起作用。你不能简单地将大量向量传递给每个向量。请查看每个函数的帮助文件(? hist? barplot? cor)以了解可能的内容。

  • cor()期望矩阵作为其第一个参数
  • hist()期望单个向量作为其第一个参数
  • barplot()期望高度向量(不是原始向量)作为其第一个参数

因此,您的cor()行可以是:

cor(cbind(PULMON.R$X0.14.años, PULMON.R$X15.44.años, PULMON.R$X45.54.años, PULMON.R$X55.64.años, PULMON.R$X65.Y.MAS.años))

但其他人需要分开绘制,你可以在循环中创建:

layout(matrix(1:5, nrow = 1))
lapply(PULMON.R[, c("X0.14.años", "X15.44.años", "X45.54.años", "X55.64.años", "X65.Y.MAS.años")], hist)