从非正态(累积)密度曲线中找出百分位数分数

时间:2017-11-17 09:33:55

标签: r ggplot2 percentile density-plot

我有一个带有一个变量的数据集和一些观察结果(假设n = 50),我已经用ggplot2绘制了一个密度曲线。由于我的原始分数不遵循正态分布,并且不存在(描绘)给定规模上的所有可能分数。我想使用平滑的密度曲线来计算某些百分位数的所有新的(或缺失的)“原始分数”。这是可能的,也许是或者我没有直接思考并使事情变得困难?我在钻石数据集中包含了一个基于克拉变量的例子。在这种情况下,原始分数范围从0到2,我想找到连接到第5,第10,第90和第95百分位数的所有(虚构)原始分数。希望有人可以帮助我并给我一些指示(为了制作诊断用的标准表)。

library(tidyverse)

seed(42)

data(diamonds) 
df <- diamonds %>% 
      filter(cut == "Ideal") %>%  # creating smaller dataset
      select(carat) %>% 
      sample_n(size = 50, replace = FALSE)

ggplot(df, aes(carat)) +
  geom_density(adjust = 1)

0 个答案:

没有答案