我使用ML.Net V 0.7.0最新版本生成了ML模型
我需要向此现有模型添加新的学习数据,而无需使用新旧数据重新生成它
因为我拥有超过1亿条记录的大型数据集
我需要添加100条记录,而无需重新加载所有最后的数据集以生成新模型
请提出任何想法
这对我很重要
最好的问候
答案 0 :(得分:4)
ML.NET中的某些培训师支持使用初始预测变量进行培训,这意味着您可以将现有预测变量用作进行新数据培训的起点。
可以here找到显示此内容的测试,其相关代码为:
// Train the first predictor.
var trainer = ml.BinaryClassification.Trainers.StochasticDualCoordinateAscent("Label", "Features",advancedSettings: s => s.NumThreads = 1);
var firstModel = trainer.Fit(trainData);
// Train the second predictor on the same data.
var secondTrainer = ml.BinaryClassification.Trainers.AveragedPerceptron("Label","Features");
var trainRoles = new RoleMappedData(trainData, label: "Label", feature: "Features");
var finalModel = secondTrainer.Train(new TrainContext(trainRoles, initialPredictor: firstModel.Model));