我需要使用朴素贝叶斯分类器对来自Elasticsearch的文本文档进行分类。 我在nltk上进行了实验,但是它确实支持增量或流数据处理。 我参考了以下文档
如果可以,可以用H2O进行增量训练吗?我也愿意使用其他支持增量挖掘的分类器。
答案 0 :(得分:1)
H2O-3可以选择检查点,但朴素贝叶斯没有。来自docs:
The checkpoint option is available for DRF, GBM, and Deep Learning algorithms. This allows you to specify a model key associated with a previously trained model. This will build a new model as a continuation of a previously generated model. If this is not specified, then the algorithm will start training a new model instead of continuing building a previous model.
如果这是您要查找的内容,则上面的链接还会链接到有关如何使用checkpointing参数的python和R代码示例。