R或Stata中分类变量的引导比例

时间:2013-08-14 17:52:29

标签: r stata statistics-bootstrap

我需要帮助在R或Stata软件中进行引导。我想计算那些说“是”和“否”的人的比例。政策的有效性

在Stata我有这段代码

bs "summarize y1" "r(mean)", reps(200) size(770)

r(mean)估算比例的价值应该是多少?

另外,我在R:

中有这段代码
test <- function (q13){
    test13 <- table(q13)
    rel_freq <- test13/sum(test13)
    return(rel_freq)
      }

results <- boot(data=q13, statistic=test,
                R=200)

如何更正代码?我收到了错误

  

统计信息出错(数据,原始,......):未使用的参数(原始)

1 个答案:

答案 0 :(得分:3)

Stata 中,如果变量包含两个以上类别,则可以使用proportion

//示例数据

sysuse auto, clear
keep if (headroom==2.0 |headroom==2.5)
gen prop=.
replace prop=0 if headroom==2.0
replace prop=1 if headroom==2.5

//说0是肯定,1是没有

set seed 123
bootstrap _b, reps(100):proportion prop

根据@Nick 更新:对于二进制变量,以下就足够了

bootstrap r(mean), reps(100): summarize prop, meanonly

............................................... .................................................. .................................................. .......................

R 中,您可以使用boot包和mtcars数据执行以下操作:

library(boot)
set.seed(123)
x<-mtcars$vs
myprop<-function(x,i){
sum(x[i]==0)/length(x)
}

bootprop <- boot(x,myprop,100)