当列是因子时,研究组在r中提取种族

时间:2015-08-05 14:19:59

标签: r factors tapply

我有一个csv文件,其中包含两个研究组的癌症数据:A和A随访(例如,治疗前后)。数据如下:

ID           Ethnicity        Study Group    
45A          Caucasian        A  
45B          Caucasian        A - follow up  
68A          Asian            A    
68B          Asian            A - follow up 

种族和研究组目前都是因素。我想通过研究小组提取种族总数,但努力寻找前进的方向。欢迎任何帮助。

2 个答案:

答案 0 :(得分:1)

使用dplyr

library(dplyr)
pairedAB %>% group_by(Study.Group, Ethnicity) %>%
        summarise(number = n()) 

答案 1 :(得分:0)

如果@jeremycg的dplyr回答产生了正确的输出(因为问题没有预期的输出),这里是data.table替代方案:

library(data.table)
pairedAB[,.(number=sum(length(ID))),by=c("Ethnicity","Study.Group")]