我有一个pybrain NN启动并运行,它似乎工作得相当好。理想情况下,我希望训练网络并在每个数据点(前几周数据,在本例中)已添加到数据集后获得预测。
目前我正在通过每次重建网络来实现这一目标,但是在添加每个示例时需要花费越来越长的时间来训练网络(每个示例在数千个示例的数据集中为+2分钟) 。。
有没有办法通过将新示例添加到已经训练过的NN并更新它来加快过程,或者我是否过度复杂化了这个问题,并且通过一组示例的训练可以更好地服务(比如去年)数据),然后测试所有新的例子(今年)?
答案 0 :(得分:1)
它取决于你的目标是什么。如果您需要更新的NN模型,您可以执行在线培训,即从您在$ t-1 $时间网络开始的时间$ t $处获取的样本执行反向传播的单步骤。或者,您可以丢弃较旧的样本以获得固定数量的训练样本,或者您可以减少执行某种聚类的训练集的大小(即将类似的样本合并为单个样本)。
如果您更好地解释您的应用程序,建议解决方案会更简单。