合并R中的两个数据集

时间:2013-06-23 05:31:39

标签: r

我有两个不同的数据集,按列格式排列如下:

数据集1:

A   B   C   D   E

13  1   1.7 2   1
13  2   5.3 2   1
13  2   2   2   1
13  2   1.8 2   1
1   6   27  9   1
1   6   6.6 9   1
1   7   17  9   1
1   7   7.1 9   1
1   7   8.5 9   1

数据集2:

A   B   F   G
13  1   42  1002
13  2   42  1002
13  2   42  1002
13  2   42  1002
13  3   42  1002
13  4   42  1002
13  5   42  1002
1   2   27  650
1   3   27  650
1   4   27  650
1   6   27  650
1   7   27  650
1   7   27  650
1   7   27  650
1   8   27  650

两个数据集的行数都是可变的,但它们包含两个样本的数据(例如,A列:13和两个数据集中的1个)。我希望数据集1的C D和E值放在数据集2中,即两个数据集中具有相同A和B值的数据集。因此,连接应该基于A和B.我需要为大约47560行执行此操作。

我是R的新手,所以如果我能获得用于在R中保存新的合并数据集的代码,应该感谢。

1 个答案:

答案 0 :(得分:4)

使用R。

中的合并功能

参考文献:http://www.statmethods.net/management/merging.html

编辑: 首先,您需要读取数据集,CSV是一种很好的格式。

> dataset1 <- read.csv(file="dataset1.csv", head=TRUE, sep=",") 
> dataset2 <- read.csv(file="dataset2.csv", head=TRUE, sep=",")

如果您现在只需键入变量名称并按Enter键,您应该会看到数据集的读数。所以......

> dataset1

应该读出上面的数据。然后我相信应该发生以下情况......我可能错了......

> dataset1_2 <- merge(dataset1, dataset2, by=c("A","B"))

编辑2:

> write.table(dataset1_2, "c:/dataset1_2.txt", sep=" ")

参考:http://www.statmethods.net/input/exportingdata.html