我有一个这样的表:
+--------+--------+--------+--------+
| Value1 | Value2 | Value3 | Value4 |
+--------+--------+--------+--------+
| 1 | 2 | 3 | 4 |
| 1 | 2 | 3 | 4 |
| 1 | 2 | 5 | 7 |
| 2 | 7 | 5 | 6 |
| 1 | 2 | 3 | 4 |
| 8 | 5 | 1 | 3 |
| 2 | 7 | 5 | 6 |
+--------+--------+--------+--------+
我想有效地做到这一点:
在所有具有相同的Value1,Value2和Value2的行中对Value4求和,并创建一个具有相应的Value1,Value2,Value3和Value4的总和的新行(在另一个数据表中)。因此输出将是这样的:
+--------+--------+--------+--------+
| Value1 | Value2 | Value3 | Value4 |
+--------+--------+--------+--------+
| 1 | 2 | 3 | 12 |
| 1 | 2 | 5 | 7 |
| 2 | 7 | 5 | 12 |
| 8 | 5 | 1 | 3 |
+--------+--------+--------+--------+
我实际上可以在R中执行此操作,但是效率不高。由于我的数据集包含24个具有13个变量的行,因此我的代码可能需要2周才能终止。
编辑:请注意,在我的实际数据集中,变量不一定是整数,而是字符。