是否可以配置hadoop流以在运行时为作业读取两个或多个输入参数?
例如,假设我有一个执行的脚本:my_script file1 file2
如何在hadoop流媒体中指定此内容?
据我所知,我只能指定具有以下执行语法的作业:
my_script "fixed_params" "input"
。
答案 0 :(得分:1)
没有多次使用流媒体,但我很确定你可以添加另一个-input
参数。
另见:Using multiple mapper inputs in one streaming job on hadoop?