当我们使用CrossValidator时,为什么我们无法定义自己的折叠?

时间:2016-06-16 20:42:17

标签: apache-spark apache-spark-mllib cross-validation apache-spark-1.5

我一直在使用cross validation进程来训练朴素贝叶斯模型,我意识到它使用kFold方法获取随机抽样数据以创建折叠。这个方法返回一个Array[(RDD[T], RDD[T])]个元组,我认为它们是用于训练和测试的不同折叠组合的集合。

我的问题是,是否有任何特定原因,因为API不允许您定义自己的折叠数组。我需要这个功能,我猜我必须编写自己的CrossValidator类才能支持该功能。我也愿意接受建议。

0 个答案:

没有答案