使用spark-ec2
启动火花群时,--ebs-vol-size
标志似乎无效。使用50
或500
进行设置,然后ssh进入主节点,df -h
会在/
上显示大约10G的空间。
如何使用spark-ec2
创建更大的EC2虚拟机?
答案 0 :(得分:6)
下面提供了一些精心设计的步骤列表,对我有用 -
关闭hadoop on ./ephemeral-hdfs
./短暂-HDFS / bin中/ stop-all.sh
在./persistent-hdfs
上启动hadoop./持久HDFS / bin中/ start-all.sh
您可以验证当前大小是否未反映所请求的ebs卷大小
./ persistent-hdfs / bin / hadoop dfsadmin -report
运行以下命令(建议将它们放入脚本中)并运行它 -
./持久HDFS / bin中/ stop-all.sh
sed -i的#vol / persistent-hdfs#vol0 / persistent-hdfs#g'~ / persistent-hdfs / conf / core-site.xml
./ spark-ec2 / copy-dir.sh~ / persistent-hdfs / conf / core-site.xml
./ spark-ec2 / copy-dir.sh~ / persistent-hdfs / conf / hdfs-site.xml
./ persistent-hdfs / bin / hadoop namenode -format
./持久HDFS / bin中/ start-all.sh
重复步骤4以验证尺寸