我正在使用VW 7.4进行二进制分类:
cat train | vw -k --binary --cache_file cache -f model --compressed --passes 10 --loss_function hinge
在测试时,我可以使用以下方式访问分数:
cat test | vw -t -i model -p pred
我没有得到的是,如果我将--bootstrap 4
添加到培训中,则生成的pred
文件包含3列。我不知道哪一个对应于预测的分数。
答案 0 :(得分:5)
当您使用--bootstrap <N>
时,vowpal-wabbit会将多个自举样本产生的置信[最大最大]间隔添加到每个预测行:
prediction tag min max
前两个字段保持不变--bootstrap
:
prediction tag
(tag
是可选的;它是从数据集中的相应示例中回显的,建议使用它)
您可以在Zhen Qin's presentation slides中找到有关他所贡献的新功能的更多详情(包括但不限于--bootstrap
)
无关,但必须提及:
你don't have to feed vowpal-wabbit from stdin
using cat file |
。您可以通过将数据集文件直接传递给vw
:
vw ... filename