Question

我有一个csv文件，其中包含两个研究组的癌症数据：A和A随访（例如，治疗前后）。数据如下：

ID           Ethnicity        Study Group    
45A          Caucasian        A  
45B          Caucasian        A - follow up  
68A          Asian            A    
68B          Asian            A - follow up

种族和研究组目前都是因素。我想通过研究小组提取种族总数，但努力寻找前进的方向。欢迎任何帮助。

Answer 1

使用dplyr：

library(dplyr)
pairedAB %>% group_by(Study.Group, Ethnicity) %>%
        summarise(number = n())

Answer 2

如果@jeremycg的dplyr回答产生了正确的输出（因为问题没有预期的输出），这里是data.table替代方案：

library(data.table)
pairedAB[,.(number=sum(length(ID))),by=c("Ethnicity","Study.Group")]

当列是因子时，研究组在r中提取种族

2 个答案: