尝试分离训练和测试集时出现 ValueError

时间:2020-12-21 11:49:48

标签: python statistics

我在 python 中尝试了以下代码:

X=df[["age","bmi","children"]].values.reshape(-1,1)
Y=df["charges"].values.reshape(-1,1)
from sklearn.preprocessing import MinMaxScaler
X_scaler = MinMaxScaler()
Y_scaler = MinMaxScaler()
X = X_scaler.fit_transform(X)
Y = Y_scaler.fit_transform(Y)
X_train, X_test, y_train, y_test = train_test_split(
    X, Y, test_size=0.2, random_state=1)

但它给了我以下错误:

ValueError: Found input variables with inconsistent numbers of samples: [2136, 712]

如果我在没有重塑的情况下这样做,它会给我:

ValueError: Expected 2D array, got 1D array instead

所以我不知道该怎么办 如果有人可以帮助我,我将不胜感激

1 个答案:

答案 0 :(得分:0)

好吧,我找到了解决方案,我已经更改了 Y:

Y = Y_scaler.fit_transform(Y.values.reshape(-1,1))

它奏效了