为何使用AWS机器学习?

时间:2017-08-08 13:58:30

标签: amazon-web-services machine-learning regression aws-sdk

我正在进行多元线性回归。我得到了大约100个不同的自变量(IV)和1个因变量(DV)。 IV可以是二进制,分类或数字 - 这里没有文字。 DV是数字。

通过亚马逊创建此模型及其机器学习算法与仅使用常规统计方法解决模型的优势是什么?

1 个答案:

答案 0 :(得分:2)

当然,您可以使用统计信息(R,Python或您选择的套件)在本地计算机上解决此问题。没有什么能阻止你这样做。

单个桌面计算机很容易触及一个因变量和数百个自变量。听起来你需要一个广义的线性模型。

我家里有一台配备32GB内存的六核AMD机器。我确定无需等待太久就可以解决您的问题。

更大的问题可能是数据清理,准备和决定这100个自变量中哪一个有意义。您需要检查它们以确保它们没有相关性。也许PCA或套索技术可以帮助你将它们降到最重要的位置。

您不知道数据集中有多少行。即使有数百万行,我也说你很安全。

我在用例中没有看到任何暗示神经网络应该是您的首选。

我会在AWS上运行机器学习算法,如果我有一个神经网络模型,其中包含许多神经元(数百万或数十亿),这些神经网络模型需要我只能从亚马逊获得的那种分布式计算能力。我已准备好拿出我的信用卡并支付特权,但如果我需要,我可以选择该选项。