我需要应用一些计量经济学方法,我必须考虑回归量中的连续变量。问题是我只有离散变量。
有人能告诉我如何将平均0的小随机误差(残差)添加到离散变量(我的数据库中的一列),并将其保存在我的数据库中吗?我还是R初学者。
示例:我有
mA <- data.frame(Asexo=c(1, 0, 0, 1, 0))
我希望向mA$Asexo
添加一个小错误,以便它成为一个连续变量:
mA <- data.frame(Asexocontiuous=c(1.03, 0.34, 0.18, 0, 1.5))
答案 0 :(得分:4)
如果你想'抖动'0/1变量以确保没有重复(或使用需要连续变量的方法),最简单的方法是
mydat$sexcont <- rnorm(nrow(mydat),mean=mydat$sexbinary,sd=csd)
其中csd
是您选择的标准偏差。更优雅一点,
mydat <- transform(mydat,sexcont=rnorm(nrow(mydat),mean=sexbinary,sd=csd))
如果sexbinary
是一个因素,那么使用as.numeric(sexbinary)
(或as.numeric(sexbinary)-1
,如果您需要它是0/1而不是1/2变量)
您还可以看到?jitter
,尽管在避免图形中的点重叠的情况下更常用。{/ p>