我正在使用Microsoft网站上的Adventure Works数据挖掘示例。在其中,我们将使用全球所有销售数据培训模型,然后使用区域和自行车模型的数据作为输入。难道这不能错误地预测,忽略该自行车模型的特定趋势吗?
这样做有什么好处?
答案 0 :(得分:1)
我认为,在开发学习者时,全球数据包含区域数据。如果您正在构建某种分类器并希望在区域级别运行它,那么您只需要使用区域特定的数据,不是吗?
每个模型都需要使用相关数据进行培训。
令人困惑的部分是,我可能不理解“区域”数据的差异。最终,全球数据肯定与您的预测模型相关。