对于课程,我们正在使用AWS EMR进行基本的推文分析。我按照本文档中的步骤操作: http://docs.aws.amazon.com/en_us/gettingstarted/latest/emr/awsgsg-emr.pdf
唯一的修改是我上传了一组预先完成的推文,我们被告知使用我们自己的配置文件进行NLTK。教师为我们提供了以下自定义NLTK配置:
#!/bin/bash
sudo yum -y install git gcc python-dev python-devel
sudo ln -sf /usr/bin/python2.7 /usr/bin/python
sudo easy_install pip
sudo pip install -U numpy
sudo pip install numpy
sudo easy_install -U distribute
sudo pip install -U setuptools
sudo pip install pyyaml nltk
sudo pip install -e git://github.com/mdp-toolkit/mdp-toolkit#egg=MDP
sudo python -m nltk.downloader -d /usr/share/nltk_data all
我创建了我的群集,当它执行时,它会进入' bootstrapping'并被困在那里45分钟。使用AMI版本3.11.0,没有Hive,Pig或HUE。
如果需要更多信息来尝试诊断,请告知我们。什么可能导致这种情况?