ggplot:使用stat_function将正态分布曲线添加到现有直方图和分布图层

时间:2016-04-12 12:20:48

标签: r ggplot2 distribution

我需要完成的任务: 1. draw x = data / y =密度直方图 - 完成 2.绘制给定数据集的分布曲线 - 完成 3.绘制该数据集的完美正态分布曲线(红线) - 问题我认为问题出现在第二次stat_function中。

代码可以运行,无需任何准备工作:

data <- data.frame(c(runif(30,1,50)),c(runif(30,50,1)))
g.data <- data[,1]

graph <- ggplot(data, aes(g.data))
graph <- graph +
geom_histogram(aes(y = ..density..), binwidth = 2, fill = 'pink') +
labs(x = 'Data', y ='Density') +
stat_function(fun = dnorm, args = list(mean = mean(g.data, na.rm = T),
sd = sd(g.data, na.rm =T)), colour ='black', size =1) +
theme(legend.position = 'none') +
stat_function(fun = dnorm, colour = "red", args = list(mean = mean(g.data)))
graph

这是我得到的

这就是我所需要的,完美的规范。分配

1 个答案:

答案 0 :(得分:1)

正态分布有2个参数:平均值和标准差。在这里,您只提供dnorm的均值,因此它假定为sd = 1

您提供的代码的更正版本是:

data <- data.frame(c(runif(30,1,50)))
ggplot(data, aes(data[,1])) +
    geom_histogram(aes(y = ..density..), binwidth = 2, fill = 'pink') +
    labs(x = 'Data', y = 'Density') +
    stat_function(fun = dnorm, 
        args = list(mean = mean(data[,1], na.rm = TRUE), 
                    sd = sd(data[,1], na.rm = TRUE)), 
        colour = 'black', size = 1) 

enter image description here