标签: h2o
h2o.splitFrame是否占多项式分类的类比例?例如,如果我的原始数据集具有三个类别,比例分别为20%,70%和10%,那么当我创建训练数据集,有效数据集和测试数据集时,它们的类比例会相似吗?
谢谢您的输入!
答案 0 :(得分:2)
不,不是。
它执行最简单的随机拆分,通过“逐行”逐行独立地处理每一行。
这种想法是,由于H2O-3旨在处理大数据,因此有足够的样本不用担心它。