我是R的新手,在线研究和咨询我的教科书时,我无法想出这个问题的答案。
所以我有一个由国会区分解的人口普查调查数据集,我已经上传到R.但是,为了我的目的,我需要每个观察都是一个国会区,每个人口统计数据点都显示为一个变量。例如,而不是Alabama的第一区出现在E列的每个数据点100次 - 我希望它出现一次,E列中的每个数据点都变成列。我还需要一种方法使其适用于数据集中的其他434区。
以下是它的外观粗略示意图:
CD | VARIABLE |数据|
AL-1 |黑人人口| 100,000 |
AL-1 |白种人| 200,000 |
AL-1 |已婚人口75,000 |
我希望它看起来像这样:
CD |黑人人口|白人人口|已婚人口|
AL-1 | 100,000 | 200,000 | 75,000 |
有关如何实现这一目标的任何想法,或者您可以指出的良好学习资源?
答案 0 :(得分:0)
以下是使用重塑功能的示例。 Joran指出,有很多选择。
DF.long<-data.frame(state = rep(c("A","B","C","D"),each=3), type =c("XX","YY","ZZ"), value = rnorm(12))
DF.long
DF.wide<-reshape(DF.long,timevar = "type",idvar="state",direction="wide")
DF.wide