我正在为相当标准的任务构建ML预测:特征数量= 30,结果值,我必须预测的是0到1之间的实数。在分析数据后,我发现了对于范围[0,0.2),[0.2,0.4)...... [0.8,1],数据看起来完全不同。我想出了构建5个模型的想法,每个模型对应一个模型,并将它们组合起来以获得更好的预测。为了检测使用哪个模型,我将构建另一个模型(可能使用NN,SVC或其他)来预测值的范围(上面的5个范围),然后相应地应用五个模型中的一个。
这里出现两个问题: 1.这有道理吗?它能提高预测质量吗? 我不认为这个想法是独一无二的,我是第一个。有人能指出我采用相同/类似的方法吗?
答案 0 :(得分:-1)
当我使用这种数据时,我也遇到了同样的问题。我将0到1之间的所有特征归一化,你可以使用任何模型,你将获得良好的分类。