将随机错误添加到R中的离散变量

时间:2011-05-26 22:15:32

标签: r variables

我需要应用一些计量经济学方法,我必须考虑回归量中的连续变量。问题是我只有离散变量。

有人能告诉我如何将平均0的小随机误差(残差)添加到离散变量(我的数据库中的一列),并将其保存在我的数据库中吗?我还是R初学者。

示例:我有

mA <- data.frame(Asexo=c(1, 0, 0, 1, 0))

我希望向mA$Asexo添加一个小错误,以便它成为一个连续变量:

mA <- data.frame(Asexocontiuous=c(1.03, 0.34, 0.18, 0, 1.5))

1 个答案:

答案 0 :(得分:4)

如果你想'抖动'0/1变量以确保没有重复(或使用需要连续变量的方法),最简单的方法是

mydat$sexcont <- rnorm(nrow(mydat),mean=mydat$sexbinary,sd=csd)

其中csd是您选择的标准偏差。更优雅一点,

mydat <- transform(mydat,sexcont=rnorm(nrow(mydat),mean=sexbinary,sd=csd))

如果sexbinary是一个因素,那么使用as.numeric(sexbinary)(或as.numeric(sexbinary)-1,如果您需要它是0/1而不是1/2变量)

您还可以看到?jitter,尽管在避免图形中的点重叠的情况下更常用。{/ p>