我有一个对应于不同类型数据集的数据集。然后如何计算大小写。
数据应分为一种情况:1)第一种情况-火车数据的15%和测试的5%
如何正确编写?
答案 0 :(得分:0)
没有createDataPartition,简单的方法如下。
假设您要从数据集train_prop
中将test_prop
作为训练集并将my_dataset
作为测试集。理想情况下,它们的总和为1
或1-val_prop
,但是出于某种原因,在这里您希望分别为15%和5%。因此您分别需要0.15和0.05。
indices <- sample(x = rep.int(x = c(0, 1, 2),
times = round(nrow(my_dataset) * c(1 - train_prop - test_prop, train_prop, test_prop))))
train_set <- my_dataset[indices == 1,]
test_set <- my_dataset[indices == 2,]