使用sklearn的实时数据

时间:2017-01-27 16:49:46

标签: python machine-learning scikit-learn real-time

我有一个健康患者数据的实时数据馈送,我用python连接。我想在这个数据源上运行一些sklearn算法,以便我可以实时预测是否有人生病。有没有一种标准方式可以将实时数据连接到sklearn?我传统上有静态数据集,从来没有传入流,所以这对我来说是新的。如果有人使用了一些通用的规则/流程/工具,那就太棒了。

2 个答案:

答案 0 :(得分:1)

大多数算法培训速度慢,预测速度快。因此,最好使用训练数据进行离线训练;然后使用训练好的模型实时预测每个新案例。

显然,如果你获得更多/更好的数据,你可能会决定再次训练。然而,在每个案例之后再培训几乎没有什么好处。

答案 1 :(得分:0)

从静态数据集训练模型并使用模型预测传入数据的分类是可行的。用每组新的患者数据重新训练模型不是那么多。还打破了测试ML模型的训练/测试模式。

训练后的模型可以保存到文件中并导入到用于实时预测的代码中。

在python scikit中,这是通过pickle包。 R编程保存到rda对象。 saveRDS

yay ...我第一次回答ML问题!