我正在使用caTools软件包中R中的sample.split函数将我的数据分为训练和测试数据以进行交叉验证。但是,我需要以测试数据为目标的方式拆分数据。这是飞行风险模型的一部分,我需要将我的测试数据用于特定的坡度和位置,而不仅仅是数据的随机分割,而只是保持住下和离开之间的比例。
spl <-sample.split(data $ Voluntary,3/4)
火车<-数据[spl,]
测试<-数据[!spl,]
此代码将我的数据分为75%的培训和25%的测试。但我希望测试仅包括data $ grade =“ G4”,“ G5”和“ G6”和data $ location =“ Houston”。有没有办法将其内置到我的代码中?