应用错误收集

我对Hadoop的实现感到困惑。我已经知道了预测类值的代码。这是构建决策树和预测值的代码

library(rvest)
page <- read_html("https://en.wikipedia.org/wiki/Midway_Atoll")
list<-html_nodes(page,css=".toctext") %>% html_text()

我是python和hadoop的初学者。我不知道如何将此程序划分为mapper和reducer。我使用hadoop-2.7.3只有3个数据节点。我可以在hadoop集群中实现这个程序来预测类值并找到准确性吗？如果没有，映射器和缩减器将如何预测类和查找准确度？