Question

我有一个包含多个列记录的数据集

    Origin    Destination      R    Total      y        z
    A.           B.            0      23       "dummy"  "rep"
    A            C             0      32       "dummy"  "rep"
    A            B             0      22       "dummy"  "rep"
    A            B             2      10       "dummy"  "rep"

我想获得比率为0且总数加起来的不同的原产地对。例如，此示例的结果将是：

    Origin    Destination      R    Total      y        z
    A.           B.            0      45       "dummy"  "rep"
    A            C             0      32       "dummy"  "rep"

我想在R中做同样的事情。有人可以建议我这样做吗？

谢谢

Answer 1

您可以执行以下操作：

df%>%  
  filter(R == 0)%>%
  group_by(Origin, Destination)%>%
  summarize(R = sum(R),
            Total = sum(Total))

您是否期望y和z始终具有相同的值？如果是这样，您可以在摘要调用中添加y = "dummy", z = "rep"。否则，不确定在这里如何组合字符串。

使用R的2个数据集的不同元组值

1 个答案: