我试图在一组文件上运行vowpal wabbit(截至目前大约10个)。我的实验如下:
将第一列火车文件转换为VW格式
使用此第一个培训文件训练大众车型并存储模型。
使用存储的模型
现在将第二个文件转换为VW格式并使用第二个文件重新训练在步骤2中存储的模型并存储更新的模型
在重新训练的模型上验证测试文件并报告准确性。
对于使用for循环的剩余文件集重复步骤4-5(每次迭代中测试文件相同)
当我做这个实验时,我遇到了一些错误。在这里,我正在粘贴火车,重新训练和验证命令以及错误。
请你帮我复制这个场景而不会出现任何错误。
命令:
这里'我'从1到10
$ idec = i -1(以前型号的索引)
vw -d $ {i} _processed_binary_compressed.vw --loss_function logistic -i $ {idec} _processed_binary_compressed.model.vw --quiet --save_resume -f $ {i} _processed_binary_compressed.model.vw
回波 echo"模型训练完成了day_ $ i"
echo" $ {i} _day模型验证正在进行中......" 回声
vw 10_processed_binary_compressed_test.vw -t -i $ {i} _processed_binary_compressed.model.vw --quiet --hash strings -p 10_processed_binary_compressed_test _ $ {i} _day_result.csv -r 10_processed_binary_compressed_test _ $ {i} _day_raw.txt
错误:
vw:option' - data'不能多次指定
答案 0 :(得分:0)
我无法复制问题(但是TOC_cmi要求粘贴我使用的共同点):
git clone https://github.com/JohnLangford/vowpal_wabbit.git
cd vowpal_wabbit
make
cd test/train-sets
vw -d rcv1_smaller.dat --loss_function=logistic --save_resume -f day1.model
vw -d rcv1_small.dat --loss_function=logistic --save_resume -i day1.model -f day2.model
vw -t -d rcv1_smaller.dat --loss_function=logistic -i day2.model -p day2.predictions -r day2.raw