Microsoft Azure机器学习的多类别分类模型的大量数据

时间:2019-11-25 01:46:41

标签: python r azure machine-learning azure-machine-learning-studio

我正在尝试使用Microsoft Azure Machine Learning Studio中的多类决策丛林进行24组分类。但是,我将用来训练模型的24个数据集中的每一个都超过了一百万行,如下图Amount of rows in each dataset所示。

下一张图片是我仅基于3个数据集制作的模型。 MultiClass Model I made

(编辑)我认为模型应该看起来像这样 The other multiclass model I made

(edit2)此模型比上一个模型具有更高的%精度 enter image description here

只有3个数据集,该模型大约需要20分钟。为了缩短训练时间,我可以为模型做些什么吗? 而且我可以做些什么,以使评估模型块不会说内存耗尽了吗?

注意:

-在编辑元数据块中,我只是在更改数据集的列名以使它们相同。

-在分区和样本块中,我只是将样本切成1,000,000行

-在其他块中,我没有做任何更改。

-我正在使用多类决策丛林块进行训练

问题摘要+其他问题:。

1:为了缩短训练时间,我可以对模型做些什么吗?

2:我可以做些什么,以使评估模型块不会说内存用完了吗(当我做24套时)?

3:使用多类决策丛林可以训练的数据量是否有最大行数?。

4:我什至有权使用多级决策丛林?

5:为此,我需要编写R脚本还是Python脚本?

最终结果:

我希望得到的是将其部署到Web服务,并且当用户输入值时,他将能够找出其数据属于哪个组。

如果有与此类似的问题,对不起,因为我无法找到任何关于此的信息,敬请原谅。如果您看到类似的信息,请提供链接。

0 个答案:

没有答案