在插入符号trainControl中进行回测或自定义拆分?

时间:2012-06-20 19:53:32

标签: r

是否可以使用train()运行数据的自定义训练/测试分区?我对回测时间序列数据感兴趣(当传统的重采样/ CV /等不合适/泄漏时)。即如果数据按时间从1 ... N开始排序,那么我会在某个截止值之前重复训练数据,以预测截止后的数据(直到某个滑动窗口大小)。在利用其余的插入符train()时,我无法确定如何解决此问题。提前感谢任何提示。

1 个答案:

答案 0 :(得分:4)

Max here。

您可以在trainControl(index = list())中指定自定义重采样索引,其中列表包含用于训练的训练数据元素。

...但是火车()将使用其他所有东西作为坚持,我不认为这是你想要的。

我可能有大约10个不同的请求这个功能。 train()需要做一些修改才能做到,但这不应该太糟糕。

但是,1)我不知道关于时间序列分析的杰克(超出简单的基础知识)所以一些带有一个或两个测试示例的原型代码会有所帮助2)直到我完成这本书(大约4个月)我赢了真的有时间这样做。

因此,如果您愿意提供一些技术位并且可以等待几个月(可以根据您希望的主动性而减少),可以通过一些修改来完成。

如果您想进一步讨论,请发送电子邮件至包裹上列出的地址。