是否可以使用train()
运行数据的自定义训练/测试分区?我对回测时间序列数据感兴趣(当传统的重采样/ CV /等不合适/泄漏时)。即如果数据按时间从1 ... N开始排序,那么我会在某个截止值之前重复训练数据,以预测截止后的数据(直到某个滑动窗口大小)。在利用其余的插入符train()
时,我无法确定如何解决此问题。提前感谢任何提示。
答案 0 :(得分:4)
Max here。
您可以在trainControl(index = list())中指定自定义重采样索引,其中列表包含用于训练的训练数据元素。
...但是火车()将使用其他所有东西作为坚持,我不认为这是你想要的。
我可能有大约10个不同的请求这个功能。 train()需要做一些修改才能做到,但这不应该太糟糕。
但是,1)我不知道关于时间序列分析的杰克(超出简单的基础知识)所以一些带有一个或两个测试示例的原型代码会有所帮助2)直到我完成这本书(大约4个月)我赢了真的有时间这样做。
因此,如果您愿意提供一些技术位并且可以等待几个月(可以根据您希望的主动性而减少),可以通过一些修改来完成。
如果您想进一步讨论,请发送电子邮件至包裹上列出的地址。