标签: hadoop machine-learning mapreduce
如您所知,可以在Hadoop集群上的Pig或Hive中使用Python。一个例子是机器学习,其中包括模型优化的交叉验证。
Hadoop作业映射到执行其任务的多个节点,之后结果将减少。如果我要在Hadoop上执行交叉验证:如何在不将交叉验证集拆分到不同节点的情况下进行映射,然后在不完整的交叉验证集上训练它们的单独模型?
感谢您的投入!