Question

我正在尝试绘制train_test _split，同时保持索引，这是我的代码。

#df.insert(0, 'x', range(0, 0 + len(df)))

X_train, X_test, y_train, y_test = train_test_split(x, y,
                                             test_size = .1)

regressor = RandomForestClassifier()

regressor.fit(X_train, y_train)

y_pred = regressor.predict(X_test)

plt.plot(X_train,y_pred_train,'bo')


plt.show()

似乎y_pred正在绘制不正确的x_axis值，因为数据中间存在巨大差距且有些重叠

如何使 y_pred 和 y_pred_train 的相应 x_value 位于数据框的原始位置。

Answer 1

您需要在图中包含索引。通常y将表示为每个点的颜色。这是怎么做的

plt.scatter(X_test.index,X_test.values,c=y_predict_test)
plt.show()

这是一个随机的例子

黄色的指针属于class0，紫色的指针属于class 1

绘制train_test_split，同时保持其指数

1 个答案: