如何在aws emr中添加ec2-user到hadoop

时间:2016-02-09 11:31:06

标签: hadoop amazon-web-services aws-sdk emr amazon-emr

我是aws emr的新手,想要添加新用户并在hadoop中创建一些目录。

所以我正在为创建目录做什么。

登录hadoop机器

ssh hadoop@(publicIP)
hadoop fs -mkdir /user
hadoop fs -mkdir /user/tomcat/
hadoop fs -chmod 777 /
hadoop fs -chmod 777 /tomcat

我想使用aws-cli或将此方法添加到EMR-bootstrap来执行此过程。

1 个答案:

答案 0 :(得分:1)

您可以在shell脚本中编写make-directory命令,并将该脚本添加为步骤。您可以在启动群集时执行此操作:

aws emr create-cluster --name "Test cluster" --ami-version 3.10 --applications Name=Hue Name=Hive Name=Pig \
--use-default-roles --ec2-attributes KeyName=myKey \
--instance-type m3.xlarge --instance-count 3 \
--steps Type=CUSTOM_JAR,Name=CustomJAR,ActionOnFailure=CONTINUE,Jar=s3://elasticmapreduce/libs/script-runner/script-runner.jar,Args=["s3://mybucket/script-path/my_script.sh"]

或在启动群集后将其添加为作业流程中的第一步:

aws emr add-steps --cluster-id <<$clusterId>> --steps Type=CUSTOM_JAR,Name=CustomJAR,ActionOnFailure=CONTINUE,Jar=s3://elasticmapreduce/libs/script-runner/script-runner.jar,Args=["s3://mybucket/script-path/my_script.sh"