我有一个csv文件,其中包含两个研究组的癌症数据:A和A随访(例如,治疗前后)。数据如下:
ID Ethnicity Study Group
45A Caucasian A
45B Caucasian A - follow up
68A Asian A
68B Asian A - follow up
种族和研究组目前都是因素。我想通过研究小组提取种族总数,但努力寻找前进的方向。欢迎任何帮助。
答案 0 :(得分:1)
使用dplyr
:
library(dplyr)
pairedAB %>% group_by(Study.Group, Ethnicity) %>%
summarise(number = n())
答案 1 :(得分:0)
如果@jeremycg的dplyr
回答产生了正确的输出(因为问题没有预期的输出),这里是data.table
替代方案:
library(data.table)
pairedAB[,.(number=sum(length(ID))),by=c("Ethnicity","Study.Group")]