应用错误收集

Hadoop是否比本地计算慢60倍？

时间：2018-04-17 17:47:35

标签： hadoop machine-learning mapreduce yarn

我在hadoop（关于正向执行）集群上做了几十个节点的机器学习任务。如果数据集大小为每300个特征10k个样本，Hadoop处理（运行常见模型，如浅层神经网络或决策树）可能需要长达6个小时。同时，在Matlab，Java或Numpy的本地机器上执行相同或类似的任务需要10-15分钟。

这对Hadoop来说是正常的还是这意味着我做错了什么？

0 个答案:

没有答案