reducer刚开始没有hadoop流媒体

时间:2012-11-20 16:43:50

标签: hadoop hadoop-streaming

我不确定发生了什么,但我写了一个简单的mapper和reducer脚本。

我正在针对一个小数据集(比如几行)测试它。

由于某种原因,reducer只是没有启动..并且mapper一次又一次地执行?

12/11/20 09:21:18 INFO streaming.StreamJob:  map 0%  reduce 0%
12/11/20 09:22:05 INFO streaming.StreamJob:  map 50%  reduce 0%
12/11/20 09:22:10 INFO streaming.StreamJob:  map 100%  reduce 0%
12/11/20 09:32:05 INFO streaming.StreamJob:  map 50%  reduce 0%
12/11/20 09:32:11 INFO streaming.StreamJob:  map 0%  reduce 0%
12/11/20 09:32:20 INFO streaming.StreamJob:  map 50%  reduce 0%
12/11/20 09:32:31 INFO streaming.StreamJob:  map 100%  reduce 0%
12/11/20 09:42:20 INFO streaming.StreamJob:  map 50%  reduce 0%
12/11/20 09:42:31 INFO streaming.StreamJob:  map 0%  reduce 0%
12/11/20 09:42:32 INFO streaming.StreamJob:  map 50%  reduce 0%
12/11/20 09:42:50 INFO streaming.StreamJob:  map 100%  reduce 0%

如果您还想要代码,请告诉我。 我出错的地方有哪些线索? 感谢

1 个答案:

答案 0 :(得分:0)

确定。我的不好..

错误发生在我的shebang,我刚刚

#!/usr/bin/env 

而不是

 #!/usr/bin/env  python

这就是诀窍:)。

虽然我很想知道为什么mapper一次又一次地运行如果我从shebang跳过python ...