无法在AWS实例

时间:2015-06-28 06:09:32

标签: amazon-web-services yarn solrcloud cloudera-manager

我一直致力于在AWS上安装solr云。作为新鲜的运行一切正常,因为我已经使用Hadoop作为依赖之一,它被理解为有高可用性..所以,虽然采取这个基础,我试图阻止cloudera经理(基本上冻结hadoop,solr,其他组件)。然后停止实例回来第二天恢复工作..但这个理论永远不会有效。以下是我在关闭和恢复之前所做的一步一步的事情。

  1. 7:55,为每个datanode和〜/ recovery目录创建文件夹,并检查每个节点的运行状况
  2. 使用帮助2。*。sh script
  3. 从所有9个主机复制namenode当前目录nn + dn
  4. 停止了cloudera经理&准备关闭群集
  5. AT 8:04群集在cloudera管理器中停止。确保事件2和事件之间有足够的时间。 3以上。
  6. 在8:05以物理方式停止aws实例。
  7. 一切都在8:08停止
  8. 再次启动所有节点..在8:12
  9. 开始一切都很好.. HDFS丢失了一些块,一些损坏了,一些丢失了
  10. Solr云失败..完全是因为观察到大多数块都属于solr云..
  11. 如你所见,我已经采取了所有的预防措施,即使我已经重新分配了nn + dd,我在关闭之前保存了它。但它不起作用..

    我第四次失败了,恢复云是一个痛苦的过程。 为什么我要这样做,我想在没有接受任何测试时为客户节省一些宝贵的钱。

    我仍然不确定为什么我可以从我的物理机器而不是从aws恢复..为什么只有Solr会丢失字节。

0 个答案:

没有答案