分层抽样非常古老,意义重大。
在h2o.ai的r接口中,他们有一种方法可以拆分帧“ h2o.splitframe”。有没有办法沿着另一列的不同元素进行分层拆分?
这里有R软件包在h2o中不这样做:
答案 0 :(得分:1)
您不需要在模型训练之前应用分层抽样,因为h2o.ai提供了不同类型的 fold_assigment 参数,包括“分层”。它在训练期间应用“分层”抽样,因此您只需要设置 fold_assingment 和 fold_column 参数。 您可以在下面的链接中找到详细信息。 http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/fold_assignment.html?highlight=stratified#example