Python Scikit学习 - 不要使用train_test_split进行随机拆分

时间:2017-01-27 02:07:39

标签: python scikit-learn

我使用Scikit学习train_test_split和随机森林进行建模。 我已经在train_test_split的random_state中设置了固定数字,比如random_state = 1,但每次运行时仍会产生不同的结果。我想要一个固定的结果来比较模型。 非常感谢。

1 个答案:

答案 0 :(得分:0)

你是什么意思"不同的结果"?我建议在将训练/测试集传递给训练代码之前,先打印一下培训/测试集的简短预览。例如:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25 random_state = 1)
print(X_train[:10])

我可以确认此代码将在多次运行中生成相同的X_train集。

然而,如果通过"不同的结果"你的意思是训练错误不同,你可能想确保你也为随机森林分类器修复随机种子。