sklearn.model_selection.train_test_split中分层方法的(无效参数)错误

时间:2019-03-05 09:28:41

标签: python scikit-learn train-test-split

我正在尝试在sklearn.model_selection.train_test_split中使用分层方法。 这是我的代码:

x=df["x"]
y=df["y"]
X_train, X_test, Y_train, Y_test = train_test_split( x, y, test_size=0.2, random_state=42,statify= y)

但是我得到这个错误

Invalid parameters passed: {'statify': 386 real....Name: y, Length: 527, dtype: object}

我正在寻找这个answer,他们提到stratify splitting是0.17版的新功能,我必须更新sklearn。 我在寻找我的版本。是0.20.2

scikit-learn              0.20.2                   pypi_0    pypi

所以请任何人都可以帮助我。

1 个答案:

答案 0 :(得分:0)

您遇到的错误表明此功能不存在参数statify。难怪...因为有错字;-)应该改成stratify,并且它应该与您的scikit-learn版本一起使用。