如何将hdfs
命令作为EMR群集中的一个步骤发出?将步骤添加为script_runner.jar
任务似乎很奇怪。
答案 0 :(得分:2)
使用command-runner.jar
并呼叫bash
发出hdfs
命令。
aws emr add-steps --cluster-id j-XXXXXXXXX --steps Name="Command Runner",Jar="command-runner.jar",Args=[/bin/bash,-c,"\"hdfs dfs -mkdir /tmp/foo\""]
请注意,最后一个参数作为单个转义引用字符串传递给bash
。