我有一个矩阵:
set.seed(23)
dt.data <- unname(as.matrix(data.frame(rnorm(5,30,2),rnorm(5,-3,1),
replicate(3,rnorm(5,5,1)))))
dt.data
# [,1] [,2] [,3] [,4] [,5]
#[1,] 30.38642 -1.892510 5.218288 5.308137 5.835391
#[2,] 29.13064 -3.278086 3.953465 4.479822 4.433985
#[3,] 31.82653 -1.980795 4.711311 4.557686 5.788419
#[4,] 33.58678 -2.954563 5.481550 4.400687 3.834071
#[5,] 31.99321 -1.424220 3.783624 6.294578 4.469180
我希望从平均值小于零或大于25的矩阵中删除所有列(即 - 上面的前2列)。我一直尝试使用apply函数:
apply(dt.data,2,
function(x) if ((mean(x,na.rm=TRUE))>25 | (mean(x,na.rm=TRUE)<0)) {
dt.data<-dt.data[,-x]
})
我可以使用另一个apply函数来检查手段并手动删除它们,但我想概括一下这个过程。上述功能不起作用,并引发以下错误:
Error in dt.data[, -x] : only 0's may be mixed with negative subscripts
任何提示?
答案 0 :(得分:1)
colMeans
应该这样做:
m <- colMeans(dt.data, na.rm=TRUE)
dt.data[, !(m > 25 | m < 0)]