有没有办法忽略geom_smooth的异常值,而不是整个图表? 我试图证明奥运会是在大城市举办的。为此,我做了一个图表:
但如果我手动减少异常值(2个观察 - 一个是2020年Bejning冬季奥运会和伦敦世界运动会),该图表看起来:
问题是我不会在图表中包含这些点,但不能用于计算。此外,我希望它对于没有统计背景的人来说很容易阅读,所以,我不想使用不同的smothing方法(我看到了黄土平滑R: How to remove outliers from a smoother in ggplot2?的答案,但在这种情况下没有帮助。
我的示例代码是:
ggplot(dane, aes(x = year, y = City_Size, col = IO_Type )) +
geom_jitter(size = 3) +
geom_smooth(method = lm, se = F, linetype = "dotted")