有人可以解释为什么在将数据分为训练和测试时我们使用random_state吗?

时间:2019-08-13 22:07:24

标签: python validation machine-learning scikit-learn

我刚刚开始在机器学习中构建模型,我想知道为什么在拆分数据时为什么要创建一个random_state变量。

1 个答案:

答案 0 :(得分:1)

它可以保存拆分的方式。如果要使用相同的数据和相同的随机状态,则将产生相同的列车测试拆分。如果要在同一数据上训练两个以上的模型并进行比较,这将很有用。使用相同的数据和相同的随机分割将确保模型在相同的数据上进行训练,从而可以进行性能对比