链接数据集之间的值

时间:2013-10-29 01:09:40

标签: regex r

我这里有点咸菜。我需要自动填充重复的单元格,并且不重复。我确定不太清楚。

在生物学研究中,有x个人。在整个研究过程中,个体的性别和体重等信息保持一致:

| Ind | S | W | 
| 1   | M | 4 |
| 2   | M | 6 |
| 3   | F | 2 |
| 4   | M | 8 |
| 5   | F | 4 |
| 6   | F | 3 |
...

有一些测量值是从个别测试对象多次获得的。现在我有两张电子表格。一个具有一致值的值,如上面列出的值,以及一个具有多个值(下面的样本A和B)的值:

| Ind |  A | B | 
|   1 | .1 | 4 |
|   1 | .2 | 6 |
|   1 | .1 | 2 |
|   1 | .3 | 8 |
|   2 | .1 | 4 |
|   2 | .1 | 3 |
|   2 | .3 | 4 |
|   3 | .2 | 6 |
|   3 | .2 | 2 |
|   3 | .1 | 8 |
|   3 | .1 | 4 |
|   3 | .1 | 3 |

基本上,在我开始对这些数据运行统计数据之前,我想在多个样本工作表上填写一致的值,我真的想避免手动操作,因为数据集比这长得多。最终结果看起来像这样:

| Ind | A  | B | S | W | 
| 1   | .1 | 4 | M | 4 |
| 1   | .2 | 6 | M | 4 |
| 1   | .1 | 2 | M | 4 |
| 1   | .3 | 8 | M | 4 |
| 2   | .1 | 4 | M | 6 |
| 2   | .1 | 3 | M | 6 |
| 2   | .3 | 4 | M | 6 |
| 3   | .2 | 6 | F | 2 |
| 3   | .2 | 2 | F | 2 |
| 3   | .1 | 8 | F | 2 |
| 3   | .1 | 4 | F | 2 |
| 3   | .1 | 3 | F | 2 |

如您所见,这些人不必具有相同数量的多个样本。是的不一致的野外工作!使用正则表达式或R执行此操作的可接受方式将非常有用!

1 个答案:

答案 0 :(得分:0)

你想要的是merge。如果在R中将它们作为两个data.frame对象读入,那么您只需:

merge(dataframe1, dataframe2)

您所要做的就是确保Ind列在两者中都具有相同的名称。