Question

我正在尝试使用 train_test_split 使我的火车数据成为索引 31 和 39 之间的数据框。我想写一些类似 X_train, X_test, y_train, y_test = train_test_split(faces.data, faces.target, test_size = 0.3) 的东西，其中 faces 是 faces = sk.datasets.fetch_olivetti_faces()

如何选择我想将哪些索引放入我的火车数据中？

Answer 1

您可以轻松提供精美的索引：

X_train=faces.data[:number what you want]
 
X_test=faces.target[:number what you want]

y_train=aces.data[number what you want]

y_test= faces.target[number what you want:]

Answer 2

正如@berkayln 建议的那样，我不确定您的训练测试拆分策略是否可取，但是要按照您的建议拆分数据，我相信您可以使用：

numbers

根据索引为 train_test_split 拆分数据帧

2 个答案: