我有一个数据帧("数据"),有7列(2个因子,5个数字)。第一列包含7个不同国家的名称,在下面的列中,我收集了表征每个国家的不同参数(如人口,GDP等)的数据。在最后一列中,因子变量指定了相应国家/地区所属的大陆。
数据如下所示:
structure(list(Country = structure(c(5L, 4L, 7L, 2L, 1L, 6L,
3L), .Label = c("Brazil", "Chile", "China", "France", "Germany",
"India", "Netherlands"), class = "factor"), GDP = c(0.46, 0.57,
0.75, 0.56, 0.28, 0.88, 1), Population = c(0.18, 0.09, 0.54,
0.01, 0.02, 0.17, 0.84), Birth.rate = c(87.21, 18.34, 63.91,
14.21, 5.38, 51.19, 209.26), Income = c(43.89, 18.23, 63.91,
12.3, 0.1, 14.61, 160.82), Savings = c(43.32, 0.11, 0, 1.91,
5.29, 36.58, 50.38), Continent = structure(c(2L, 2L, 2L, 3L,
3L, 1L, 1L), .Label = c("Asia", "Europe", "South America"), class = "factor")), .Names = c("Country",
"GDP", "Population", "Birth.rate", "Income", "Savings", "Continent"
), class = "data.frame", row.names = c(NA, -7L))
我需要某种循环函数,它将每一列相互绘制(例如散点图),以便最后每列(除了第一列和最后一列,即两个因子变量)都是针对所有其他列绘制的列,但每个都在单图表(并非所有图中的一个)。最好将所有这些图保存到本地计算机上的某个文件夹中。
如果已经根据相互绘制的相应两列标记了x和y轴,那将是很好的。此外,在图中每个点旁边都有一个标签显示相应的国家名称会很方便。最后,根据三大洲的不同,有三种不同的颜色可供选择。
到目前为止,我只有一段像
的代码for (i in seq(1,length(data),1)) {
plot(data[,i], ylab=names(data[i]), xlab="Country",
text(i, labels=Country, pos=4, cex =.5))
}
正如你所看到的那样,它只会在第一列(" Country")中绘制每一列,这最终不是我想要的。
你知道我怎么能做到这一点吗?谢谢!
答案 0 :(得分:4)
您可以直接使用来自R的pairs()
。请注意,dt
代表您的数据集。
pairs(dt)
dt <- structure(list(Country = structure(c(5L, 4L, 7L, 2L, 1L, 6L,
3L), .Label = c("Brazil", "Chile", "China", "France", "Germany",
"India", "Netherlands"), class = "factor"), GDP = c(0.46, 0.57,
0.75, 0.56, 0.28, 0.88, 1), Population = c(0.18, 0.09, 0.54,
0.01, 0.02, 0.17, 0.84), Birth.rate = c(87.21, 18.34, 63.91,
14.21, 5.38, 51.19, 209.26), Income = c(43.89, 18.23, 63.91,
12.3, 0.1, 14.61, 160.82), Savings = c(43.32, 0.11, 0, 1.91,
5.29, 36.58, 50.38), Continent = structure(c(2L, 2L, 2L, 3L,
3L, 1L, 1L), .Label = c("Asia", "Europe", "South America"), class = "factor")), .Names = c("Country",
"GDP", "Population", "Birth.rate", "Income", "Savings", "Continent"
), class = "data.frame", row.names = c(NA, -7L))
答案 1 :(得分:1)