使用R的不同方法进行引导的结果不同

时间:2019-03-21 14:56:39

标签: r simulation lapply

我正在尝试使用2种方法使用R进行引导。一种方法是手动方法,另一种方法是使用引导程序包。 我的问题是我得到的结果略有不同。我想知道是否是由于我的手动处理方法出了问题。

数据集:https://drive.google.com/open?id=1bSNKGpSEJqmSozQz88d158mchBO45Mje

我的代码如下,

 data1 <- read.table("CH11TA10.txt", quote="\"", comment.char="",col.names = c("X","Y"))
    set.seed(1) #sampling from 2 or more columns simultenouly 
    require(dplyr)
    lst <- replicate(
      5,
      df.smpl <- data1 %>% sample_n(length(data1$Y), replace = T),
      simplify = FALSE)
    bets <- lapply(lst, function(data2) coefficients(lm(Y ~ X, data = data2))[2])
    mean(unlist(bets, use.names = T))

    mean(unlist(bets, use.names = T)) -coef(lm(Y~X ,data=data1))[2]

    # -0.0003327845 


    require(boot)

    fit.reg <- function(data, index) {
      result <- coef(lm(Y ~ X , data = data, subset = index))
      return(result)
    }
    n <- nrow(data1)
    set.seed(1)
    reg.boot <- boot(data1, fit.reg, R = 5)




      Call:
boot(data = data1, statistic = fit.reg, R = 5)


Bootstrap Statistics :
      original       bias    std. error
t1* 56.1569294  0.386268071  3.26540381
t2*  0.5800308 -0.009682677  0.09946742
> 

有人可以帮助我解决问题吗? 谢谢。

0 个答案:

没有答案