有效训练,测试验证数据集拆分

时间:2020-02-13 22:52:44

标签: machine-learning

使用温度,降雨和降雪等天气来预测美国不同城市的某些产品销售。到目前为止,我有两种火车测试解决方案:验证拆分: 1.支持随机抽取5个城市,将其余数据拆分90%10%作为火车测试。支持用作验证集的城市。我想看看该模型对看不见的数据进行预测的效果如何。在生产中,我有看不见的城市。

  1. 使用所有城市,随机分配80、10、10作为火车,测试和验证。

您认为哪个更好?

另一个问题是数据中是否存在降雨事件,如何确保,训练,测试,验证集都具有一定数量的降雨事件?

0 个答案:

没有答案