Question

我有一个矩阵A，填充了形状为10x10的随机值。如何在每一行上执行一个函数（找到第75个分位数），并将该行中A中的每个元素除以该结果？

在下面的尝试中，我得到q的单个值，但q应该至少为10个值（每行一个）。那时我应该能够用A/q进行元素划分。我做错了什么？

A <- matrix(rnorm(10 * 10), 10, 10)
q <- c(quantile(A[1,], 0.75))
A/q

Answer 1

来自rowQuantiles包的matrixStats：

library(matrixStats)
res <- A / rowQuantiles(A, probs=0.75)

同样的结果？

identical(apply(A, 1, quantile, probs=0.75), rowQuantiles(A, probs=0.75))
[1] TRUE

它更快吗？

library(microbenchmark)

    microbenchmark(apply=apply(A, 1, quantile, probs=0.75),
                   matStat=rowQuantiles(A, probs=0.75))
    Unit: microseconds
        expr     min       lq    mean   median      uq       max neval cld
       apply 788.298 808.9675 959.816 829.3515 855.154 13259.652   100   b
     matStat 246.611 267.2800 278.302 276.1180 284.386   362.075   100  a

在这个矩阵上，绝对是。

在更大的矩阵（1000 X 1000）上怎么样？

A <- matrix(rnorm(1e6), 1000, 1000)

microbenchmark(apply=apply(A, 1, quantile, probs=0.75),
               matStat=rowQuantiles(A, probs=0.75))
Unit: milliseconds
    expr       min       lq     mean    median       uq      max neval cld
   apply 115.57328 123.4831 183.1455 139.82021 308.3715 353.1725   100   b
 matStat  74.22657  89.2162 136.1508  95.41482 113.0969 745.1526   100  a

不那么戏剧化，但仍然是（忽略最大值）。

Answer 2

使用apply解决了这个问题，如下所示：

A <- matrix(rnorm(10 * 10), 10, 10)
q <- apply(A, 1, quantile, probs = c(0.75),  na.rm = TRUE)
A <- A/q

技术上回答了这个问题，但是矢量化方法会很好。

将函数（分位数）应用于矩阵行并使用结果修改行

2 个答案:

将函数（分位数）应用于矩阵行并使用结​​果修改行

2 个答案:

将函数（分位数）应用于矩阵行并使用结果修改行