我使用以下代码在R中创建了以下图:
ggplot(sentiment, aes(x = year, y = nrc_sent$sentiment)) +
geom_smooth(method = "auto") + # pick a method & fit a model
scale_x_continuous(breaks = round(seq(min(sentiment$year), max(sentiment$year), by = 2),1))+
labs(x="", y="")
geom_smooth()
using method = 'loess'
(运行代码时收到此消息)
nrc_sent
代表
> nrc_sent
# A tibble: 519 x 3
sentiment state year
<dbl> <chr> <dbl>
1 152. Alabama 2007.
2 107. Alabama 2008.
3 80. Alabama 2009.
4 75. Alabama 2010.
5 173. Alabama 2011.
6 180. Alabama 2012.
7 187. Alabama 2013.
8 167. Alabama 2014.
9 124. Alabama 2015.
10 215. Alabama 2016.
# ... with 509 more rows
我很疑惑这条线周围的阴影区域代表什么。我查看了ggplot help page,但似乎没有任何信息可以在我的学术文章中用来解释图表代表什么,以及阴影区域是什么。我将不胜感激任何帮助
答案 0 :(得分:1)
如果您查看geom_smooth的文档:?geom_smooth
,它会指出参数se
用于控制拟合线周围是否存在置信区间。如果是TRUE
,则会指示您查看level
level
是使用默认值为0.95的置信区间。
我的猜测是这对你也有用。真正与关卡一起玩。
ggplot(sentiment, aes(x = year, y = nrc_sent$sentiment)) +
geom_smooth(method = "loess", se=TRUE,level=0.95) + # pick a method & fit a model
scale_x_continuous(breaks = round(seq(min(sentiment$year), max(sentiment$year), by = 2),1))+
labs(x="", y="")