我有一些传感器,可从水泥厂获取数据并将数据发送到AWS IoT。然后在预先训练的模型上测试数据,该模型根据一些参数预测水泥的质量。数据每隔一秒钟就会发送一次。
由于数据是实时的,所以我想实时地逐步训练模型。
有人可以建议如何连续训练模型吗?
答案 0 :(得分:2)
您可以汇总一定数量的训练数据,然后使用.partial_fit()
更新模型。
.partial_fit()
是增量学习选项,在Sklearn中可用。
如果增量数据不能放入RAM,则值得尝试dask-ml wrapper for incremental learning。