'sum'对于使用dplyr的因子错误没有意义

时间:2016-02-22 10:12:55

标签: r dplyr

我的数据框如下:

row.names   V1  V2  V3  Rptname V5  V6  V7  V8  V9
1   14651   chr1    61025432    61029742    MIRb    chr1    61025451    62627425    hsa-mir-3116-2_NFIA_INADL_TM2D1 0
2   14652   chr1    61036393    61037479    L2a chr1    61025451    62627425    hsa-mir-3116-2_NFIA_INADL_TM2D1 0
3   14653   chr1    61039074    61041631    MIRb    chr1    61025451    62627425    hsa-mir-3116-2_NFIA_INADL_TM2D1 0
4   14654   chr1    61040277    61041060    L1PA13  chr1    61025451    62627425    hsa-mir-3116-2_NFIA_INADL_TM2D1 0
5   14655   chr1    61042625    61045428    L2a chr1    61025451    62627425    hsa-mir-3116-2_NFIA_INADL_TM2D1 0
6   14656   chr1    61048474    61050832    MLT1B   chr1    61025451    62627425    hsa-mir-3116-2_NFIA_INADL_TM2D1 0
7   14657   chr1    61053709    61057268    L2a chr1    61025451    62627425    hsa-mir-3116-2_NFIA_INADL_TM2D1 0
8   14658   chr1    61059515    61060022    L2a chr1    61025451    62627425    hsa-mir-3116-2_NFIA_INADL_TM2D1 0
9   14659   chr1    61065721    61066525    MLT1B   chr1    61025451    62627425    hsa-mir-3116-2_NFIA_INADL_TM2D1 

我想使用dplyr计算Rptname列的频率。

我使用过这段代码:

library(dplyr)

GroupedTableProportionampBRCA <- 
  ampBRCA_Filtered %>% 
  group_by(Rptname) %>% 
  summarise(freq = sum(Rptname))

但有些事情发生了变化,现在它告诉我:

  

错误:'sum'对因子无意义

1 个答案:

答案 0 :(得分:2)

我们使用Uri表示频率不是n()

sum()

或使用df %>% group_by(Rptname) %>% summarise(freq = n()) # Rptname freq # (fctr) (int) #1 L1PA13 1 #2 L2a 4 #3 MIRb 2 #4 MLT1B 2

count