ggplot stat_quantile中的分位数是多少?

时间:2015-12-28 19:44:00

标签: r ggplot2 quantreg

这是我可重复的数据:

library("ggplot2")
library("ggplot2movies")
library("quantreg")    
set.seed(2154)
msamp <- movies[sample(nrow(movies), 1000), ]

我正在尝试熟悉stat_quantile,但文档中的示例提出了几个问题。

mggp <- ggplot(data=msamp, mapping=aes(x=year, y=rating)) + 
    geom_point() + 
    stat_quantile(formula=y~x, quantiles=c(0, 0.25, 0.50, 0.75, 1)) + 
    theme_classic(base_size = 12) + 
    ylim(c(0,10))
mggp
  1. 根据我的理解,分位数将数据分成小于定义的截止值的部分,对吗?如果我像下面的代码中那样定义分位数,我得到五行。为什么?它们代表什么?

  2. 似乎分数是基于y轴上的因变量(评级)计算的。有可能扭转这种局面吗?我的意思是根据'年'中的分位数来分割数据?

1 个答案:

答案 0 :(得分:2)

此函数执行分位数回归,每行都是

的指标

来自Wikipedia

  

分位数回归是一种用于统计和计量经济学的回归分析。鉴于给定预测变量的某些值,最小二乘法导致估计接近响应变量的条件均值,而分位数回归旨在估计响应变量的条件中值或其他分位数。

因此,回归图中的每一行都是分位数值的估计,例如,中位数,第75百分位和第100百分位。

您可以在vignette包的quantreg中找到详细的技术讨论。

enter image description here