我想知道WSO2 ML是否实现了交叉验证和网格搜索以获得最佳模型选择。
答案 0 :(得分:0)
目前,(从1.1.0版本开始)WSO2机器学习者没有直接的超参数优化方法。正如您的问题所述,我们计划在即将发布的版本中包含随机搜索和网格搜索。为了跟踪这个过程的进展,我创建了一个公共JIRA [1]。因此,当新功能准备就绪时,我将通过此SO问题通知您。
接下来,让我简要介绍一下我们在WSO2机器学习服务器中使用的交叉验证过程。在ML Server的ML向导的第三步中,您可以设置训练数据分数(请参阅随附的屏幕截图)。
因此,假设您选择0.7个数据进行培训。然后,模型构建过程将使用70%的数据进行训练,其余的数据集(即30%)将用于交叉验证。您可能认为这是交叉验证的最基本方法,并不特别适合小型数据集。因此,在即将发布的版本中,除了目前可用的交叉验证方法之外,我们还计划包括K-fold交叉验证[2]。
Yandi,如果您对此问题或与我们产品相关的任何问题需要进一步的帮助,请告知我们。
谢谢,
Upul
[1] https://wso2.org/jira/browse/ML-313
[2] https://en.wikipedia.org/wiki/Cross-validation_(statistics)#k-fold_cross-validation