R - 解释中的ggplot平滑

时间:2018-03-16 00:19:29

标签: r ggplot2 smoothing

Count of words over time

我使用以下代码在R中创建了以下图:

          ggplot(sentiment, aes(x = year, y = nrc_sent$sentiment)) + 
        geom_smooth(method = "auto") +  # pick a method & fit a model
        scale_x_continuous(breaks = round(seq(min(sentiment$year), max(sentiment$year), by = 2),1))+
        labs(x="", y="")

geom_smooth() using method = 'loess'(运行代码时收到此消息)

nrc_sent代表

> nrc_sent
# A tibble: 519 x 3
sentiment state year
         <dbl> <chr> <dbl>
1 152. Alabama 2007.
 2 107. Alabama 2008.
 3 80. Alabama 2009.
 4 75. Alabama 2010.
 5 173. Alabama 2011.
 6 180. Alabama 2012.
 7 187. Alabama 2013.
 8 167. Alabama 2014.
 9 124. Alabama 2015.
10 215. Alabama 2016.
# ... with 509 more rows

我很疑惑这条线周围的阴影区域代表什么。我查看了ggplot help page,但似乎没有任何信息可以在我的学术文章中用来解释图表代表什么,以及阴影区域是什么。我将不胜感激任何帮助

1 个答案:

答案 0 :(得分:1)

如果您查看geom_smooth的文档:?geom_smooth,它会指出参数se用于控制拟合线周围是否存在置信区间。如果是TRUE,则会指示您查看level level是使用默认值为0.95的置信区间。

我的猜测是这对你也有用。真正与关卡一起玩。

ggplot(sentiment, aes(x = year, y = nrc_sent$sentiment)) + 
        geom_smooth(method = "loess", se=TRUE,level=0.95) +  # pick a method & fit a model
        scale_x_continuous(breaks = round(seq(min(sentiment$year), max(sentiment$year), by = 2),1))+
        labs(x="", y="")