R:如何操作CSV数据库

时间:2016-04-11 21:46:43

标签: r excel csv dataset

我是R的新手,在线研究和咨询我的教科书时,我无法想出这个问题的答案。

所以我有一个由国会区分解的人口普查调查数据集,我已经上传到R.但是,为了我的目的,我需要每个观察都是一个国会区,每个人口统计数据点都显示为一个变量。例如,而不是Alabama的第一区出现在E列的每个数据点100次 - 我希望它出现一次,E列中的每个数据点都变成列。我还需要一种方法使其适用于数据集中的其他434区。

以下是它的外观粗略示意图:

CD | VARIABLE |数据|

AL-1 |黑人人口| 100,000 |

AL-1 |白种人| 200,000 |

AL-1 |已婚人口75,000 |

我希望它看起来像这样:

CD |黑人人口|白人人口|已婚人口|

AL-1 | 100,000 | 200,000 | 75,000 |

有关如何实现这一目标的任何想法,或者您可以指出的良好学习资源?

1 个答案:

答案 0 :(得分:0)

以下是使用重塑功能的示例。 Joran指出,有很多选择。

DF.long<-data.frame(state = rep(c("A","B","C","D"),each=3), type =c("XX","YY","ZZ"), value = rnorm(12))
DF.long

DF.wide<-reshape(DF.long,timevar = "type",idvar="state",direction="wide")
DF.wide