Question

我使用以下代码生成data.frame＆＃39; df＆＃39;来自我的原始数据＆＃39; pseudo＆＃39;。

> df<-pseudo %>% group_by(Drug, CLSI_interpretation) %>% 
      summarise(n = n()) %>% 
      filter(Drug %in% c('Cefepime', 'Ceftazidime', 'Piperacillin','Piperacillin/tazobactam','Imipenem','Meropenem','Doripenem','Ciprofloxacin','Levofloxacin','Gentamicin','Tobramycin','Amikacin')) %>% 
      mutate(freq = (n/sum(n)*100))

还有一个非常长的mapvalues函数，用于创建＆＃39;类＆＃39;药物＆＃39;的专栏。

到目前为止一切顺利;生成如下所示的数据集：

Drug         CLSI   n       freq        class
Amikacin        I   7213    4.25503047  Aminoglycosides
Amikacin        R   13995   8.25580915  Aminoglycosides
Amikacin        S   148309  87.48916038 Aminoglycosides
Cefepime        I   13326   8.87713502  Cephalosporins
Cefepime        R   9744    6.49098031  Cephalosporins  
Cefepime        S   127046  84.63188468 Cephalosporins
Ceftazidime     I   10836   5.98558290  Cephalosporins
Ceftazidime     R   15276   8.43814732  Cephalosporins
Ceftazidime     S   154923  85.57626978 Cephalosporins
Ciprofloxacin   I   8949    4.74295103  Fluoroquinolones
Ciprofloxacin   R   31563   16.72832309 Fluoroquinolones

我在接下来的步骤中挣扎。我需要按照＆＃39; class＆＃39;对这些数据进行分组，并且对于每个类的总数，＆＃39; n＆＃39; CLSI％in％c（＆＃39; I＆＃39;＆＃39; R＆＃39;）并产生一个新频率...基本上，n（I + R）/ n（I + R + S）和每个班级的n（S）/ n（I + R + S）。在计算汇总函数时遇到很多麻烦，因为我需要根据对另一个（CLSI）的引用来总结一个变量（n），并按第三个（类）进行分组。谢谢你的帮助。

Answer 1

显示完整的代码（包括读取数据）总是很好。看起来pseudo是您的数据。 %>%管道中项目的语法与通常的R略有不同，因为第一个参数隐式地是管道内容。或者，简单地说：从你的电话中删除“伪”。

library(dplyr)
pseudo = read.table("a.csv",header=TRUE)
pseudo <- pseudo %>%
  group_by(class, CLSI) %>% summarise(n= n())

dplyr管道：总结中的复杂功能

1 个答案: