我是vowpal wabbit的新手,所以对此有一些疑问。
我将数据集传递给vw并拟合模型并获得样本内预测,并使用-f保存模型。到现在为止还挺好。我知道如何使用模型并对不同的数据集进行预测。但我想知道如何为模型添加更多观察并更新它。
主要目标:使用一些数据块首先使vw在线学习,然后使用该模型预测某些数据。然后使用新数据更新模型。然后使用更新的数据预测另一个新的观察结果,这个过程应继续进行。
正如我所说的我是新手,所以请尽量原谅问题的微不足道
答案 0 :(得分:6)
vw -i existing.model -f new.model more_observations.dat
助记符:
-i
首字母-f
final 您甚至可以在-i
和-f
中使用相同的模型文件名来更新" 就地"因为它不是真正就地。模型替换在运行结束时以原子方式发生(将临时文件重命名为最终文件),如以下strace
输出中所示(添加了注释):
$ strace -e open,close,rename vw --quiet -i zz.model -f zz.model f20-315.tt.gz
# loading the initial (-i zz.model) model into memory
open("zz.model", O_RDONLY) = 3
# done loading, so we can close it
close(3) = 0
# Now reading the data-set and learning in memory
open("f20-315.tt.gz", O_RDONLY) = 3
# data read complete. write the updated model into a temporary file
open("zz.model.writing", O_WRONLY|O_CREAT|O_TRUNC, 0666) = 4
close(4) = 0
# and rename atomically to the final (-f zz.model) model file
rename("zz.model.writing", "zz.model") = 0
...
close(4) = 0
close(3) = 0
+++ exited with 0 +++