summary.rq输出取决于样本量

时间:2018-12-13 14:34:59

标签: r quantile-regression

我发现(见下文)Quantreg程序包中的函数summary.rq(第88页)会打印不同的输出,具体取决于样本大小是等于还是小于1001。

我知道,rq()使用不同的方法,具体取决于样本大小是等于还是小于1001。我认为这就是这种行为的原因。

显示所描述行为的MWE:

> library(quantreg)
> x <- seq(0, 100, length.out = 1000)     
> e <- rnorm(1000, mean = 0, sd = 1.2)
> y <- 6 + 0.1 * x + e  
> summary(rq(y ~ x, tau = 0.025))

Call: rq(formula = y ~ x, tau = 0.025)

tau: [1] 0.025

Coefficients:
            coefficients lower bd upper bd
(Intercept) 3.67733      2.92776  3.88165 
x           0.10061      0.09578  0.10675 
Warning message:
In rq.fit.br(x, y, tau = tau, ci = TRUE, ...) : Solution may be 
nonunique

> x <- seq(0, 100, length.out = 1001)     
> e <- rnorm(1001, mean = 0, sd = 1.2)
> y <- 6 + 0.1 * x + e  
> summary(rq(y ~ x, tau = 0.025))

Call: rq(formula = y ~ x, tau = 0.025)

tau: [1] 0.025

Coefficients:
            Value    Std. Error t value  Pr(>|t|)
(Intercept)  3.61744  0.28052   12.89559  0.00000
x            0.10033  0.00477   21.04017  0.00000

这是理想的行为吗?对于大于1000的样本量,如何获得第一种输出形式?

我的问题是,我在多个样本大小的循环中使用了summary.rq函数,并希望使用上限和下限值。

1 个答案:

答案 0 :(得分:1)

输出之间的差异不是来自// Assuming this is in an `async` function try { try { await Promise.reject('oe'); } catch (innerError) { console.log('bbbbb', innerError); throw innerError; } } catch (outerError) { console.log('aaaaa', outerError); } ,而是来自rq()summary.rq()对小于1000的样本量使用“等级”推断方法,否则使用“ nid”。帮助文件表明,对于较大的样本量,“等级”方法可能非常慢。如果您坚持要在所有循环研究中显示以前的输出,则可以指定

quantreg

但是,更仔细地研究可能会更好。例如,如果您的某些研究样本量非常大,则计算可能会变得非常缓慢,您可能希望为所有研究指定summary(rq(y ~ x, tau = 0.025),se="rank")并手动计算上限和下限(se="nid"和{ {1}}。