Ritter中的“抖动”功能是什么?

时间:2013-07-09 12:01:11

标签: r

根据documentationjitter函数的解释是“向数字向量添加少量噪音。”

这是什么意思?

是一个随机数与向量中的每个数字相关联并添加到其中吗?

2 个答案:

答案 0 :(得分:18)

抖动确实意味着只是将随机噪声添加到数值向量中,默认情况下,这是通过从均匀分布中提取样本在 jitter 函数中完成的。如果未提供 amount - 参数,则根据数据选择抖动中的值范围。

我认为术语'抖动'涵盖了除均匀之外的其他分布,并且通常用于更好地可视化重叠值,例如整数协变量。这有助于掌握观测密度高的地方。优良作法是在图例中提及某些值是否已被抖动,即使它是显而易见的。下面是一个带有抖动函数的示例可视化以及正态分布抖动,其中我任意抛出值sd = 0.1:

n <- 500
set.seed(1)
dat <- data.frame(integer = rep(1:3, each=n), continuous = c(rnorm(n, mean=1), rnorm(n, mean=2), rnorm(n, mean=3))^2)

par(mfrow=c(3,1))
plot(dat, main="No jitter for x-axis", xlab="Integer", ylab="Continuous")
plot(jitter(dat[,1]), dat[,2], main="Jittered x-axis (uniform distr.)", xlab="Integer", ylab="Continuous")
plot(dat[,1]+rnorm(3*n, sd=0.1), dat[,2], main="Jittered x-axis (normal distr.)", xlab="Integer", ylab="Continuous")

enter image description here

答案 1 :(得分:3)

关于抖动效应及其必要性的一个非常好的解释可以在R的回归模型的Swirl课程中找到。

弗朗西斯·加尔顿爵士的父母和他们孩子的高度之间的关系需要数据,并在图表上绘制而没有抖动,然后是抖动。

这是没有抖动的人(情节(孩子〜父母,加尔顿)):

enter image description here

这是有抖动的那个(请忽略回归线)(情节(jitter(child,4)〜parent,galton)):

enter image description here

课程说如果你没有抖动,很多人会有相同的高度,所以点数相互叠加,这就是为什么第一个情节中的某些圆圈看起来比其他圆圈更暗的原因。但是,通过使用R&#34; jitter&#34;在孩子们的身高上,我们可以分散数据来模拟测量误差,使高频高度更加明显。