我的数据框如下:
row.names V1 V2 V3 Rptname V5 V6 V7 V8 V9
1 14651 chr1 61025432 61029742 MIRb chr1 61025451 62627425 hsa-mir-3116-2_NFIA_INADL_TM2D1 0
2 14652 chr1 61036393 61037479 L2a chr1 61025451 62627425 hsa-mir-3116-2_NFIA_INADL_TM2D1 0
3 14653 chr1 61039074 61041631 MIRb chr1 61025451 62627425 hsa-mir-3116-2_NFIA_INADL_TM2D1 0
4 14654 chr1 61040277 61041060 L1PA13 chr1 61025451 62627425 hsa-mir-3116-2_NFIA_INADL_TM2D1 0
5 14655 chr1 61042625 61045428 L2a chr1 61025451 62627425 hsa-mir-3116-2_NFIA_INADL_TM2D1 0
6 14656 chr1 61048474 61050832 MLT1B chr1 61025451 62627425 hsa-mir-3116-2_NFIA_INADL_TM2D1 0
7 14657 chr1 61053709 61057268 L2a chr1 61025451 62627425 hsa-mir-3116-2_NFIA_INADL_TM2D1 0
8 14658 chr1 61059515 61060022 L2a chr1 61025451 62627425 hsa-mir-3116-2_NFIA_INADL_TM2D1 0
9 14659 chr1 61065721 61066525 MLT1B chr1 61025451 62627425 hsa-mir-3116-2_NFIA_INADL_TM2D1
我想使用dplyr计算Rptname列的频率。
我使用过这段代码:
library(dplyr)
GroupedTableProportionampBRCA <-
ampBRCA_Filtered %>%
group_by(Rptname) %>%
summarise(freq = sum(Rptname))
但有些事情发生了变化,现在它告诉我:
错误:'sum'对因子无意义
答案 0 :(得分:2)
我们使用Uri
表示频率不是n()
sum()
或使用df %>% group_by(Rptname) %>% summarise(freq = n())
# Rptname freq
# (fctr) (int)
#1 L1PA13 1
#2 L2a 4
#3 MIRb 2
#4 MLT1B 2
count