在R中的数据集中注入离群值

时间:2019-01-09 14:12:14

标签: r outliers

我正在通过线性回归y = b0 + b1x + e *生成n = 20的数据集(我不确定我是否应该在代码中包括误差项)。

  • x和y正态分布,均值为0,标准差为1。
  • 误差项e也被认为是均值为0和sd的正态分布 1,但在y方向具有10%的异常值

我的代码以此开头

n11 <- 20
m1 <- 0
sd1<- 1
b0 <- 0
b1 <- 1
x <- rnorm(n11,m1, sd1)

y <- b0 + b1*x + e11

e11 <- rnorm(n11,m1, sd1)

data11<-data.frame(y,x,e11,b0,b1)

model1<-lm(y~x, data=data11)

我不知道我应该如何以及在哪里将上述10%相同的异常值写在代码上,我需要帮助。非常感谢。

0 个答案:

没有答案