Question

我有一个矩阵：

set.seed(23)
dt.data <- unname(as.matrix(data.frame(rnorm(5,30,2),rnorm(5,-3,1),
              replicate(3,rnorm(5,5,1)))))
dt.data
#         [,1]      [,2]     [,3]     [,4]     [,5]
#[1,] 30.38642 -1.892510 5.218288 5.308137 5.835391
#[2,] 29.13064 -3.278086 3.953465 4.479822 4.433985
#[3,] 31.82653 -1.980795 4.711311 4.557686 5.788419
#[4,] 33.58678 -2.954563 5.481550 4.400687 3.834071
#[5,] 31.99321 -1.424220 3.783624 6.294578 4.469180

我希望从平均值小于零或大于25的矩阵中删除所有列（即 - 上面的前2列）。我一直尝试使用apply函数：

apply(dt.data,2,
  function(x) if ((mean(x,na.rm=TRUE))>25 | (mean(x,na.rm=TRUE)<0)) {
  dt.data<-dt.data[,-x]
})

我可以使用另一个apply函数来检查手段并手动删除它们，但我想概括一下这个过程。上述功能不起作用，并引发以下错误：

Error in dt.data[, -x] : only 0's may be mixed with negative subscripts

任何提示？

Answer 1

colMeans应该这样做：

m <- colMeans(dt.data, na.rm=TRUE)
dt.data[, !(m > 25 | m < 0)]

有条件地从矩阵中删除列

1 个答案: