我目前使用stat_ecdf绘制累积频率图。
这是我使用的代码
cumu_plot <- ggplot(house_total_year, aes(download_speed, colour = ISP)) +
stat_ecdf(size=1)
但是我想要逆转ecdf(补充ecdf)。有关最简单方法的任何想法吗?
干杯!
答案 0 :(得分:13)
来自stat_ecdf的帮助页面:
计算变量
X
数据中的x
ý
累积密度对应x
这样可行:
p <- ggplot(dataframe_with_column_Z, aes(x=Z))
p + geom_line(aes(y = 1 - ..y..), stat='ecdf')
答案 1 :(得分:0)
因为似乎没有更简单的方法来绘制逆ecdf,所以我有人在寻找解决方案时所做的事情:
从ecdf函数中提取信息并将其存储在新列
中house_total_year_ecdf <- ddply(house_total_year, c("ISP"), mutate,
ecdf = ecdf(download_speed)(unique(download_speed))*length(download_speed))
#transforming the scale to (0,1)
house_total_year_ecdf_2 <- ddply(house_total_year_ecdf, "ISP", mutate,
ecdf =scale(ecdf,center=min(ecdf),scale=diff(range(ecdf))))
使用geom_step和y = 1-ecdf
绘制图形ggplot(house_total_year_ecdf_2, aes(download_speed,1-ecdf, colour = ISP)) +
geom_step()
答案 2 :(得分:0)
如果您要使用该软件包,则可以添加到aes():
y = 1 - ..y..
也就是说,
cumu_plot <- ggplot(house_total_year, aes(download_speed, colour = ISP, y = 1 - ..y..)) + stat_ecdf(size=1)
就我而言,我用以下方法产生了以下内容:
ecdf_gg3 <- ggplot(sim_output_A.m, aes(x=loss, color=plan, y = 1 - ..y..)) +
stat_ecdf(show.legend=FALSE) +
labs(
title="Simulated Loss Output",
x = "Loss amount",
y = "Probability of exceeding amount")+
scale_x_continuous(labels = dollar_format())+
scale_y_continuous(labels = percent_format()) +
scale_fill_viridis(discrete=TRUE)+
scale_color_viridis(discrete=TRUE)