我有一个在线购物网站的历史数据,就像是;
userID date timeonSite IsAnomaly?
123 01/01/2012 12:38 14 1
548 01/01/2012 19:56 12 0
它每天都有数百万行并且每天都在增长。使用R和MSSQL。
根据timeonSite值为每个用户行为尝试创建ml模型。并预测“下一个价值是异常/异常值吗?”
计划使用逻辑回归。但我需要一个增量/在线学习模型,用于每周或每月重新训练用户模型。我无法在每次培训课程中使用所有历史数据。
有没有包可以做到这一点?回归不是一条红线,我对“ts,svm,knn等”等其他方法持开放态度。