来自频率表的累积概率图

时间:2012-09-12 18:59:59

标签: r ggplot2

有没有办法从频率表中绘制累积概率?我的意思是它的“平滑”版本,类似于geom_density()绘图的方式。

到目前为止,我设法将单独计算的概率绘制为由线连接的点,但它看起来不太好。

2 个答案:

答案 0 :(得分:3)

我生成了一些测试数据:

set.seed(1)
x <- sort(sample(1:100, 20))
p <- runif(x); p <- cumsum(p)/sum(p)
table <- data.frame(x=x, prob=p)

您可以使用ggplot2包中的geom_smooth。

require("ggplot2")
qplot(x=x, y=p, data=table, aes(ymin=0, ymax=1)) + ylab("ecf") + 
geom_smooth(se=F, stat="smooth", method="loess", fullrange=T, fill="lightgrey", size=1)

作为替代方案,通过参数指定平滑的简单方法是从decon包中尝试DeconCdf:

require("decon")
plot(DeconCdf(x, sig=1))

如果要使用ggplot,首先必须在data.frame中转换Decon函数对象。

f <- DeconCdf(x, sig=1)
m <- ggplot(data=data.frame(x=f$x, p=f$y), aes(x=x, y=p, ymin=0, ymax=1)) + ylab("ecf")
m + geom_line(size=1)

使用sig-Parameter作为平滑参数:

f <- DeconCdf(x, sig=0.3)
m <- ggplot(data=data.frame(x=f$x, p=f$y), aes(x=x, y=p, ymin=0, ymax=1)) + ylab("ecf")
m + geom_line(size=1)

答案 1 :(得分:0)

此版本绘制了一个直方图,其中包含来自geom_density的平滑线:

# Generate some data:
set.seed(28986)
x2 <- rweibull(100, 1, 1/2)

# Plot the points:
library(ggplot2)
library(scales)
ggplot(data.frame(x=x2),aes(x=x, y=1-cumsum(..count..)/sum(..count..))) +
  geom_histogram(aes(fill=..count..)) +
  geom_density(fill=NA, color="black", adjust=1/2) +
  scale_y_continuous("Percent of units\n(equal to or larger than x)",labels=percent) +
  theme_grey(base_size=18)

enter image description here 请注意,由于个人喜好,我使用了1 - “累积概率”(我觉得它看起来更好,我习惯于处理“reliability”指标),但显然这只是一个你可以忽略的偏好删除1-中的aes部分。