我有两个不同的数据集,按列格式排列如下:
数据集1:
A B C D E
13 1 1.7 2 1
13 2 5.3 2 1
13 2 2 2 1
13 2 1.8 2 1
1 6 27 9 1
1 6 6.6 9 1
1 7 17 9 1
1 7 7.1 9 1
1 7 8.5 9 1
数据集2:
A B F G
13 1 42 1002
13 2 42 1002
13 2 42 1002
13 2 42 1002
13 3 42 1002
13 4 42 1002
13 5 42 1002
1 2 27 650
1 3 27 650
1 4 27 650
1 6 27 650
1 7 27 650
1 7 27 650
1 7 27 650
1 8 27 650
两个数据集的行数都是可变的,但它们包含两个样本的数据(例如,A列:13和两个数据集中的1个)。我希望数据集1的C D和E值放在数据集2中,即两个数据集中具有相同A和B值的数据集。因此,连接应该基于A和B.我需要为大约47560行执行此操作。
我是R的新手,所以如果我能获得用于在R中保存新的合并数据集的代码,应该感谢。
答案 0 :(得分:4)
使用R。
中的合并功能参考文献:http://www.statmethods.net/management/merging.html
编辑: 首先,您需要读取数据集,CSV是一种很好的格式。
> dataset1 <- read.csv(file="dataset1.csv", head=TRUE, sep=",")
> dataset2 <- read.csv(file="dataset2.csv", head=TRUE, sep=",")
如果您现在只需键入变量名称并按Enter键,您应该会看到数据集的读数。所以......
> dataset1
应该读出上面的数据。然后我相信应该发生以下情况......我可能错了......
> dataset1_2 <- merge(dataset1, dataset2, by=c("A","B"))
编辑2:
> write.table(dataset1_2, "c:/dataset1_2.txt", sep=" ")