我正在尝试实施一个推荐系统uisng Mahout框架。由于我没有Linux机器,我不能使用Hadoop来处理大型的martrix。 (在Windows上安装Hadoop的教程对我不起作用。)
我的用户有三种类型的功能,每种类型包含5到9个功能。我想知道我是否可以将这些功能构建到一个FileDataModel中,或者我是否可以单独处理每组功能并组合结果。
如果后一个工作,那么我需要使用上一个处理结果中的UserIds为下一组功能创建一个新的FileDataModel。它可行吗?
在这里,我仍然有一些问题,我没有找到答案,希望任何人都可以提供帮助:在没有Hadoop的情况下,在Windows环境中可以使用多少功能?在一种算法投入生产后,我们需要多久重新优化一次系统?它会自动运作吗?谢谢。
答案 0 :(得分:0)
嗯..如果它没有找到HADOOP_HOME env变量集,那么可以在没有hadoop的情况下运行。另一方面......我不确定mahout是否可以立即在Window上运行,因为我没有找到任何.bat文件或如果你想在windows上运行它们,你需要为hadoop和mahout安装cygwin。
与未设置HADOOP_HOME时Pig的工作方式非常相似。