我有一个看起来像这样的数据框(随着框架的进展所有线程的值):
head(icdata)
Count Thread1 Thread2 Thread3 Thread4 Thread5 Thread6 Thread7 Thread8
1 8543034 555724 NA NA NA NA NA NA NA
2 26632195 730156 NA NA NA NA NA NA NA
3 46332821 730679 NA NA NA NA NA NA NA
4 47491531 22694 16715 NA NA NA NA NA NA
5 48939781 62418 114842 NA NA NA NA NA NA
6 50397031 63560 38147 NA NA NA NA NA NA
我想将Count与各种线程的总和进行对比,但是无法解决如何做到这一点 - 例如,NA值似乎只是在对行进行求和时会产生问题。很抱歉提出这样一个基本问题,但我该怎么办呢?
(另外,我希望能够根据计数的差异对这个总数进行标准化,但这不太重要)
答案 0 :(得分:3)
使用rowSums
对各个线程中的值求和。 na.rm
参数负责NAs。此外,您希望从总和中排除第一列:
thread.sum <- rowSums(icdata[,-1], na.rm=TRUE)
plot(icdata[,1], thread.sum)