首先,我是R的新手并试图找到自己的方式,但我很难找到一个看起来非常简单的动作的答案。我有一个带有两列的数据框(应用程序)
Customer Application
1 1
1 0
1 0
1 1
1 1
1 0
1 1
1 0
1 0
1 1
1 1
申请率
sum(Applications$Application)/sum(Applications$Customer).
我被要求通过运行1000个客户的1000个样本来获得该应用率,以获得应用率的分布和置信水平。我尝试使用boot
包,如下所示
f2 <- function(Loan,Customer){sum(Applications$Application)/sum(Applications$Customer)}
bootapp1 <-(boot(Applications, f2, 1000))
bootapp1
ORDINARY NONPARAMETRIC BOOTSTRAP
Call:
boot(data = Bootstrap_Test, statistic = f2, R = 1000)
Bootstrap Statistics :
original bias std. error
t1* 0.003052608 0 0
显然这不是我想要的,因为它没有给出任何偏见或标准错误。
有人能告诉我快速获得我需要的结果吗?我想必须有一种非常简单的方法。
答案 0 :(得分:0)
你只需要调整你的函数,这需要两个参数。在Table storage engine for 'table_name' doesn't have that option
上的帮助文件中,在boot
:
当应用于数据时返回包含感兴趣统计量的向量的函数。当sim =&#34;参数&#34;时,统计的第一个参数必须是数据。对于每个复制,将传递由ran.gen返回的模拟数据集。在所有其他情况下,统计必须至少采用两个参数。传递的第一个参数将始终是原始数据。第二个是定义引导样本的索引,频率或权重的向量。
statistic