Hadoop流式传输具有多个参数的作业

时间:2012-09-10 17:59:31

标签: hadoop hadoop-streaming

是否可以配置hadoop流以在运行时为作业读取两个或多个输入参数?

例如,假设我有一个执行的脚本:my_script file1 file2

如何在hadoop流媒体中指定此内容?

据我所知,我只能指定具有以下执行语法的作业: my_script "fixed_params" "input"

1 个答案:

答案 0 :(得分:1)

没有多次使用流媒体,但我很确定你可以添加另一个-input参数。

另见:Using multiple mapper inputs in one streaming job on hadoop?