绘制train_test_split,同时保持其指数

时间:2018-02-12 07:22:26

标签: python matlab plot machine-learning scikit-learn

我正在尝试绘制train_test _split,同时保持索引,这是我的代码。

#df.insert(0, 'x', range(0, 0 + len(df)))

X_train, X_test, y_train, y_test = train_test_split(x, y,
                                             test_size = .1)

regressor = RandomForestClassifier()

regressor.fit(X_train, y_train)

y_pred = regressor.predict(X_test)

plt.plot(X_train,y_pred_train,'bo')


plt.show()

似乎y_pred正在绘制不正确的x_axis值,因为数据中间存在巨大差距且有些重叠

如何使 y_pred y_pred_train 的相应 x_value 位于数据框的原始位置。

1 个答案:

答案 0 :(得分:0)

您需要在图中包含索引。通常y将表示为每个点的颜色。这是怎么做的

plt.scatter(X_test.index,X_test.values,c=y_predict_test)
plt.show()

这是一个随机的例子 enter image description here

黄色的指针属于class0,紫色的指针属于class 1