GPFS到HDFS迁移

时间:2017-04-27 09:45:06

标签: hadoop migration hdfs bigdata

我有一个IBM的BigInsight集群,我有~5k Hive表和其他HBASE数据以及一些Big SQL表。所有数据文件都采用不同的格式,即Text,Avro,bz2等。 现在要从BigInsight迁移到HDP(Hortonworks数据平台),我需要了解如何将数据从GPFS移动到HDFS。

  1. 您能解释一下GPFS和HDFS之间的架构差异吗?是两个Namenode将工作类似。 Namespace有哪些变化。复制命名空间不起作用。
  2. 如何从其他Hadoop群集访问GPFS - 只需distcp就可以了?
  3. 迁移时我们可能面临的挑战是什么。
  4. 我有一些选择:

    • nfs gateway
    • distscp
    • httpfs
    • WebHDFS REST API
    • SCP - 安全副本

    我唯一担心的是所有这些选项中的哪一个可以适用于GPFS和HDFS。如果没有针对我的场景测试这些,我应该选择的其他替代选项是什么。

    请建议任何解决方案,我需要注意的其他事项。

    感谢。 问候, Pardeep Sharma。

0 个答案:

没有答案