如何在vowpal wabbit中重新训练模型的文件序列

时间:2014-11-28 10:11:58

标签: vowpalwabbit

我试图在一组文件上运行vowpal wabbit(截至目前大约10个)。我的实验如下:

  1. 将第一列火车文件转换为VW格式

  2. 使用此第一个培训文件训练大众车型并存储模型。

  3. 使用存储的模型

  4. 验证测试文件的准确性
  5. 现在将第二个文件转换为VW格式并使用第二个文件重新训练在步骤2中存储的模型并存储更新的模型

  6. 在重新训练的模型上验证测试文件并报告准确性。

  7. 对于使用for循环的剩余文件集重复步骤4-5(每次迭代中测试文件相同)

  8. 当我做这个实验时,我遇到了一些错误。在这里,我正在粘贴火车,重新训练和验证命令以及错误。

    请你帮我复制这个场景而不会出现任何错误。

    命令:

    这里'我'从1到10

    $ idec = i -1(以前型号的索引)

    vw -d $ {i} _processed_binary_compressed.vw --loss_function logistic -i $ {idec} _processed_binary_compressed.model.vw --quiet --save_resume -f $ {i} _processed_binary_compressed.model.vw

    回波  echo"模型训练完成了day_ $ i"

    echo" $ {i} _day模型验证正在进行中......"  回声

    vw 10_processed_binary_compressed_test.vw -t -i $ {i} _processed_binary_compressed.model.vw --quiet --hash strings -p 10_processed_binary_compressed_test _ $ {i} _day_result.csv -r 10_processed_binary_compressed_test _ $ {i} _day_raw.txt

    错误:

    vw:option' - data'不能多次指定

1 个答案:

答案 0 :(得分:0)

我无法复制问题(但是TOC_cmi要求粘贴我使用的共同点):

git clone https://github.com/JohnLangford/vowpal_wabbit.git
cd vowpal_wabbit
make
cd test/train-sets

vw -d rcv1_smaller.dat --loss_function=logistic --save_resume -f day1.model
vw -d rcv1_small.dat --loss_function=logistic --save_resume -i day1.model -f day2.model
vw -t -d rcv1_smaller.dat --loss_function=logistic -i day2.model -p day2.predictions -r day2.raw