使用bootstrapping预测vowpal wabbit中的文件格式

时间:2014-07-18 20:19:01

标签: vowpalwabbit

我正在使用VW 7.4进行二进制分类:

cat train | vw -k --binary --cache_file cache -f model --compressed --passes 10 --loss_function hinge

在测试时,我可以使用以下方式访问分数:

cat test | vw -t -i model -p pred

我没有得到的是,如果我将--bootstrap 4添加到培训中,则生成的pred文件包含3列。我不知道哪一个对应于预测的分数。

1 个答案:

答案 0 :(得分:5)

当您使用--bootstrap <N>时,vowpal-wabbit会将多个自举样本产生的置信[最大最大]间隔添加到每个预测行:

prediction tag min max

前两个字段保持不变--bootstrap

prediction tag

tag是可选的;它是从数据集中的相应示例中回显的,建议使用它)

您可以在Zhen Qin's presentation slides中找到有关他所贡献的新功能的更多详情(包括但不限于--bootstrap

无关,但必须提及:

don't have to feed vowpal-wabbit from stdin using cat file |。您可以通过将数据集文件直接传递给vw

来保存进程
vw ... filename