您好我正在尝试在"滚动窗口中运行时间序列交叉验证"风格:即训练有8周的数据,下周测试,滑动1周。
实现这一目标的最有效方法是什么?
我已将数据文件拆分为每周块。所以我希望将多个文件传递给--data参数(我尝试重复--data)。
这不起作用,但似乎可以使用多个缓存文件。 AFAIK,这需要我首先从我的文本文件块中创建缓存文件块。我不清楚如何调用vw来创建缓存文件?
答案 0 :(得分:2)
您可以在stdin上管道数据(用cat
连接所有文件)。但是,由于vw
默认情况下进行在线学习,因此无需手动执行"滚动窗口" (和缓存文件),除非您想使用多个培训通行证。只需存储模型(使用--save_resume -f path/to/the.model
),然后下周继续使用新数据进行培训。