使用管道和bash脚本在hadoop HDInsight中编写映射减少

时间:2018-02-01 21:23:51

标签: bash python-3.x hadoop mapreduce hadoop-streaming

我正在尝试在hadoop流,HDInsight中做地图减少工作。我接近它的方式是我有一个映射器,它管理我创建的许多其他脚本(包括bash和python),最终得到key \ tvalue选项。我按预期将所有文件复制到所有节点。但是,我一直收到如下所示的错误。可能是什么原因 - 在bash中出现问题?

Error: java.lang.RuntimeException: PipeMapRed.waitOutputThreads(): subprocess failed with code 1
at org.apache.hadoop.streaming.PipeMapRed.waitOutputThreads(PipeMapRed.java:322)
at org.apache.hadoop.streaming.PipeMapRed.mapRedFinished(PipeMapRed.java:535)
at org.apache.hadoop.streaming.PipeMapper.close(PipeMapper.java:130)
at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:61)
at org.apache.hadoop.streaming.PipeMapRunner.run(PipeMapRunner.java:34)
at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:453)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:343)
at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:170)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:422)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1866)
at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:164)

0 个答案:

没有答案