我正在使用geom_smooth
包中的ggplot2
来创建时间序列散点图上的平滑线(一年中每天的一个点,所以我有365分)。其中一个参数称为span
,并进入帮助文件(?geom_smooth
),给出以下描述:
span
控制默认黄土平滑器的平滑量。较小的数字会产生较扭曲的线条,较大的数字会产生更平滑的线条。
但是,这实际上并没有告诉我span参数是什么控制的。将其设置为1是没用的,将其设置为0.1可以提供看起来很好的东西。
span = 0.5
span = 0.1
但是,在描述情节时,由于我不完全确定span
实际发生了什么变化,我不确定如何描述平滑线。有什么指针吗?
答案 0 :(得分:7)
LOESS平滑是一种非参数形式的回归,它使用加权滑动窗口平均值来计算最佳拟合线。在每个"窗口"中,计算加权平均值,滑动窗口沿x轴传递。
可以使用span参数控制此窗口的大小。 span元素控制alpha,即平滑程度。范围越小,“窗口”越小,因此线条越嘈杂/越多。
在LOESS而不是span下查找文档。
答案 1 :(得分:4)
跨度(也定义为alpha)将在平滑数据时确定移动窗口的宽度。
“在黄土拟合中,alpha参数确定滑动窗口的宽度。更具体地说,alpha给出了在每个局部回归中使用的观察的比例。因此,此参数被指定为0之间的值用于图2中黄土曲线的α值为0.65;因此,用于产生该曲线的每个局部回归均占总数据点的65%。“
取自:
Jacoby (2000) Loess:: a nonparametric, graphical tool for depicting relationships between variables. Electoral Studies 19-4.(Paywalled paper)
有关详细信息,请查看参考文件。