我在独立模式下运行hbase实例。 我打算将其迁移到分布式模式(3台机器的集群)。 我的问题是,我可以从独立模式迁移到分布式而不会丢失独立模式的数据吗? 是否有必要在分布式模式下使用HDFS?
答案 0 :(得分:0)
(H)adoop(d)istributed(F)ILE(S)ystem。这是促进分布式Hbase的因素。如果您使用本机FS,则不再进行分发。所以,这不是一个选择。分布式意味着存储(以及计算)分布在所有参与的机器上,这与本机FS的工作方式相反。
来到你的第一个问题,你可以做到这一点。从独立模式迁移到分布式模式应该只是从本地磁盘复制到HDFS。要为自己确认这一点并不难。确保首先正确设置Hadoop集群。作为预防措施,备份您的Hbase数据。
答案 1 :(得分:0)
正如Tariq所说,你需要一个分布式的FS for HBase才能工作。关于复制数据,可以尝试distcp