我正在尝试使用Microsoft Azure Machine Learning Studio中的多类决策丛林进行24组分类。但是,我将用来训练模型的24个数据集中的每一个都超过了一百万行,如下图所示。
只有3个数据集,该模型大约需要20分钟。为了缩短训练时间,我可以为模型做些什么吗? 而且我可以做些什么,以使评估模型块不会说内存耗尽了吗?
注意:
-在编辑元数据块中,我只是在更改数据集的列名以使它们相同。
-在分区和样本块中,我只是将样本切成1,000,000行
-在其他块中,我没有做任何更改。
-我正在使用多类决策丛林块进行训练
。
问题摘要+其他问题:。
1:为了缩短训练时间,我可以对模型做些什么吗?
2:我可以做些什么,以使评估模型块不会说内存用完了吗(当我做24套时)?
3:使用多类决策丛林可以训练的数据量是否有最大行数?。
4:我什至有权使用多级决策丛林?
5:为此,我需要编写R脚本还是Python脚本?
最终结果:
我希望得到的是将其部署到Web服务,并且当用户输入值时,他将能够找出其数据属于哪个组。
如果有与此类似的问题,对不起,因为我无法找到任何关于此的信息,敬请原谅。如果您看到类似的信息,请提供链接。