我正在尝试使用mahout,hadoop和java构建推荐引擎。这是我第一次使用hadoop,我从已安装hadoop的服务器获取我的数据集,这是一个linux环境。我的开发环境是windows,现在我需要在我的开发环境或服务器上安装mahout吗?如果我需要在我的开发环境中使用mahout,我还需要在其中安装hadoop吗?
答案 0 :(得分:1)
如果您的计算机上没有Hadoop,Mahout将在当前计算机上以伪分布式模式运行。
尽管如此,Windows和Hadoop并不真正喜欢彼此,并且根据您的Mahout版本(更具体地说,它具有Hadoop依赖性),您很可能会遇到此问题(link)。问题出现在Hadoop 0.20.204之后(虽然我必须承认我不知道它是否已在最新版本的Hadoop上修复)