我们正在探索使用MR来并行化长时间运行的进程。我们所有的数据目前都存在于RDBMS中。我们知道HDFS是MR的基础文件数据存储,但不确定如下:
答案 0 :(得分:0)
我认为您不必将所有RDBMS数据移至HDFS以使用MR。让我们来看看Sqoop如何将数据从RDBMS加载到HBase / HDFS。
Sqoop将在[DBInputFormat]
1(a connector that allows Hadoop MapReduce programs to read rows from SQL databases)的帮助下通过MapReduce加载数据。
答案 1 :(得分:0)