在python中手动创建训练和测试数据集

时间:2020-03-26 23:11:05

标签: python dataframe machine-learning

我正在尝试将数据集手动拆分为训练和测试数据集,这意味着我不想使用scikit Learn软件包。我希望以某种方式拆分它们,如果行索引模块4等于零,则将它们放入训练数据集中,否则将它们放入测试数据集中。我已经在R中完成了以下操作:

testidx = which(1:nrow(price_accommodates_bedrooms )%%4 == 0)
df_train = price_accommodates_bedrooms [-testidx, ]
df_test = price_accommodates_bedrooms[testidx, ]

但是我不确定如何在python中进行操作,因为我是python的新手。预先感谢

1 个答案:

答案 0 :(得分:0)

如果要执行此操作,可以利用DataFrame索引和掩码:

test_df = df[df.index % 4 != 0]
train_df = df[df.index % 4 == 0]