我在我的OSX笔记本电脑上运行了简单的Hadoop流媒体示例,但我对结果感到惊讶。用PHP计算的简单单词(每个10K以下的5个文件)花了将近1分钟。这是正常的情况还是我做错了什么?
处理由命令启动:
bin/hadoop jar contrib/streaming/hadoop-streaming-1.0.3.jar -mapper /tmp/mr/mapper.php -reducer /tmp/mr/reducer.php -input input/* -output gutenberg-output