使用R的2个数据集的不同元组值

时间:2019-07-15 04:29:19

标签: r

我有一个包含多个列记录的数据集

    Origin    Destination      R    Total      y        z
    A.           B.            0      23       "dummy"  "rep"
    A            C             0      32       "dummy"  "rep"
    A            B             0      22       "dummy"  "rep"
    A            B             2      10       "dummy"  "rep"

我想获得比率为0且总数加起来的不同的原产地对。例如,此示例的结果将是:

    Origin    Destination      R    Total      y        z
    A.           B.            0      45       "dummy"  "rep"
    A            C             0      32       "dummy"  "rep"

我想在R中做同样的事情。有人可以建议我这样做吗?

谢谢

1 个答案:

答案 0 :(得分:0)

您可以执行以下操作:

df%>%  
  filter(R == 0)%>%
  group_by(Origin, Destination)%>%
  summarize(R = sum(R),
            Total = sum(Total))

您是否期望y和z始终具有相同的值?如果是这样,您可以在摘要调用中添加y = "dummy", z = "rep"。否则,不确定在这里如何组合字符串。