标签: hadoop machine-learning mapreduce yarn
我在hadoop(关于正向执行)集群上做了几十个节点的机器学习任务。如果数据集大小为每300个特征10k个样本,Hadoop处理(运行常见模型,如浅层神经网络或决策树)可能需要长达6个小时。同时,在Matlab,Java或Numpy的本地机器上执行相同或类似的任务需要10-15分钟。
这对Hadoop来说是正常的还是这意味着我做错了什么?