ML.net将新数据添加到现有生成的模型中

时间:2018-11-15 11:50:32

标签: ml.net

我使用ML.Net V 0.7.0最新版本生成了ML模型

我需要向此现有模型添加新的学习数据,而无需使用新旧数据重新生成它

因为我拥有超过1亿条记录的大型数据集

我需要添加100条记录,而无需重新加载所有最后的数据集以生成新模型

请提出任何想法

这对我很重要

最好的问候

1 个答案:

答案 0 :(得分:4)

ML.NET中的某些培训师支持使用初始预测变量进行培训,这意味着您可以将现有预测变量用作进行新数据培训的起点。

可以here找到显示此内容的测试,其相关代码为:

// Train the first predictor.
var trainer = ml.BinaryClassification.Trainers.StochasticDualCoordinateAscent("Label", "Features",advancedSettings: s => s.NumThreads = 1);
var firstModel = trainer.Fit(trainData);

// Train the second predictor on the same data.
var secondTrainer = ml.BinaryClassification.Trainers.AveragedPerceptron("Label","Features");

var trainRoles = new RoleMappedData(trainData, label: "Label", feature: "Features");
var finalModel = secondTrainer.Train(new TrainContext(trainRoles, initialPredictor: firstModel.Model));