我正在尝试在sklearn.model_selection.train_test_split
中使用分层方法。
这是我的代码:
x=df["x"]
y=df["y"]
X_train, X_test, Y_train, Y_test = train_test_split( x, y, test_size=0.2, random_state=42,statify= y)
但是我得到这个错误
Invalid parameters passed: {'statify': 386 real....Name: y, Length: 527, dtype: object}
我正在寻找这个answer,他们提到stratify splitting
是0.17版的新功能,我必须更新sklearn
。
我在寻找我的版本。是0.20.2
scikit-learn 0.20.2 pypi_0 pypi
所以请任何人都可以帮助我。
答案 0 :(得分:0)
您遇到的错误表明此功能不存在参数statify
。难怪...因为有错字;-)应该改成stratify
,并且它应该与您的scikit-learn
版本一起使用。