使用" train_test_split"进行模型评估不是静止的?

时间:2017-03-05 15:10:36

标签: python machine-learning scikit-learn

根据网上资源" train_test_split" sklearn.cross_validation模块中的函数以随机状态返回数据。

这是否意味着如果我使用相同的数据训练两次模型,我会得到两个不同的模型,因为在每种情况下学习过程中使用的训练数据点是不同的?

在实践中,这两种型号的准确度差异很大吗?这是一种可能的情况吗?

1 个答案:

答案 0 :(得分:1)

您可以将random_state参数设置为某个常量值以重现数据拆分。另一方面,通常一个好主意是准确测试你想要知道的东西 - 即用不同的randoms状态至少运行两次训练并比较结果。如果它们差别很大,则表明出现问题并且您的解决方案不可靠。