标签: apache-spark predictionio
我正在使用PredictionIO模型在具有默认参数的示例数据集上训练,构建和部署为服务。
现在我有一个场景,其中数据集每天(逐渐)变得越来越大,我想了解PredictionIO Model如何检测新数据并对其进行训练并将其作为服务进行部署?
由于PredictionIO将数据存储在事件服务器中并能够使用Apache SparkMLlib分发数据,因此它如何检测数据集中有新数据可用?
预先感谢您的帮助