根据索引为 train_test_split 拆分数据帧

时间:2021-04-04 19:34:26

标签: python pandas scikit-learn

我正在尝试使用 train_test_split 使我的火车数据成为索引 31 和 39 之间的数据框。 我想写一些类似 X_train, X_test, y_train, y_test = train_test_split(faces.data, faces.target, test_size = 0.3) 的东西,其中 facesfaces = sk.datasets.fetch_olivetti_faces()

如何选择我想将哪些索引放入我的火车数据中?

2 个答案:

答案 0 :(得分:1)

您可以轻松提供精美的索引:

X_train=faces.data[:number what you want]
 
X_test=faces.target[:number what you want]

y_train=aces.data[number what you want]

y_test= faces.target[number what you want:]

答案 1 :(得分:1)

正如@berkayln 建议的那样,我不确定您的训练测试拆分策略是否可取,但是要按照您的建议拆分数据,我相信您可以使用:

numbers