管道行汇总的简单方法

时间:2020-09-18 15:05:08

标签: r dataframe dplyr tidyverse rowsum

我有以下数据框(显示了头部样本)

dput(sample)
structure(list(VR1 = c(NA, NA, 1L, NA, 0L, NA), VR2 = c(NA, 
NA, 
NA, NA, NA, NA), VR3 = c(NA, NA, 0L, NA, 0L, NA), VR4 = c(NA, 
NA, 1L, NA, 0L, NA), VR5 = c(NA, NA, 1L, NA, 1L, NA), VR6 = 
c(NA, 
NA, 0L, NA, 0L, NA), VR7 = c(NA, NA, 1L, NA, 0L, NA), VR8 = 
c(NA, 
NA, 0L, NA, 0L, NA), VR9 = c(NA, NA, 1L, NA, 1L, NA), VR10 = 
c(NA, 
NA, 1L, NA, 0L, NA), VR11 = c(NA, NA, 0L, NA, 0L, NA), VR12 = 
c(NA, 
NA, 0L, NA, 0L, NA), VR13 = c(NA, NA, 1L, NA, 0L, NA), VR14 = 
c(NA, 
NA, 1L, NA, 0L, NA), VR15 = c(NA, NA, 1L, NA, 1L, NA), VR16 = 
c(NA, 
NA, 0L, NA, 0L, NA), VR17 = c(NA, NA, 1L, NA, 0L, NA), VR18 = 
c(NA, 
NA, 1L, NA, 1L, NA), VR19 = c(NA, NA, 1L, NA, 0L, NA), VR20 = 
c(NA, 
NA, 1L, NA, 0L, NA)), row.names = c(NA, 6L), class = 
"data.frame")

我正在做很多先前的操作(例如删除列),但是我没有找到将简单的rowums传递到新列的函数。这是我一直在尝试的 sample <- sample %>% mutate(total = rowSums(1:20))

我一直在互联网上寻找 sum(c_across

但是R不能识别它,尽管加载了tidyverse和dplyr

1 个答案:

答案 0 :(得分:1)

dplyr选项会c_across(),但需要一个行ID:

library(dplyr)
#Code
sample %>% mutate(id=1:n())%>%
  rowwise(id) %>%
  mutate(total=sum(c_across(VR1:VR20),na.rm=T))

输出:

# A tibble: 6 x 22
# Rowwise:  id
    VR1 VR2     VR3   VR4   VR5   VR6   VR7   VR8   VR9  VR10  VR11  VR12  VR13  VR14  VR15  VR16
  <int> <lgl> <int> <int> <int> <int> <int> <int> <int> <int> <int> <int> <int> <int> <int> <int>
1    NA NA       NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA
2    NA NA       NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA
3     1 NA        0     1     1     0     1     0     1     1     0     0     1     1     1     0
4    NA NA       NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA
5     0 NA        0     0     1     0     0     0     1     0     0     0     0     0     1     0
6    NA NA       NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA    NA
# ... with 6 more variables: VR17 <int>, VR18 <int>, VR19 <int>, VR20 <int>, id <int>, total <int>

使用的数据是您共享的dput(sample)