应用错误收集

你可以在火花中使用MLlib替代mahout。 MLlib中的所有库都以分布式模式处理（Hadoop中的Map-reduce）。

在Mahout 0.10中，通过spark提供作业执行。

用mahout设置火花。

1转到解压缩Spark的目录并键入sbin / start-all.sh以在本地启动Spark

2打开浏览器，将其指向http://localhost:8080/以检查Spark是否已成功启动。复制页面顶部的spark master的url（以spark：//开头）

3定义以下环境变量： export MAHOUT_HOME = [签出Mahout的目录] 导出SPARK_HOME = [解压缩Spark的目录] export MASTER = [Spark master的url]

4最后，转到你解压缩Mahout的目录并输入bin / mahout spark-shell，你应该看到shell启动并得到提示mahout＆gt;。查看常见问题解答以进一步排查故障。

请访问link。它使用新的mahout 0.10并使用spark服务器。