使用多个数据文件的vowpal wabbit(用于时间序列交叉验证)

时间:2018-04-23 11:28:39

标签: vowpalwabbit

您好我正在尝试在"滚动窗口中运行时间序列交叉验证"风格:即训练有8周的数据,下周测试,滑动1周。

实现这一目标的最有效方法是什么?

我已将数据文件拆分为每周块。所以我希望将多个文件传递给--data参数(我尝试重复--data)。

这不起作用,但似乎可以使用多个缓存文件。 AFAIK,这需要我首先从我的文本文件块中创建缓存文件块。我不清楚如何调用vw来创建缓存文件?

1 个答案:

答案 0 :(得分:2)

您可以在stdin上管道数据(用cat连接所有文件)。但是,由于vw默认情况下进行在线学习,因此无需手动执行"滚动窗口" (和缓存文件),除非您想使用多个培训通行证。只需存储模型(使用--save_resume -f path/to/the.model),然后下周继续使用新数据进行培训。