我正在尝试以下方案:
我有简单的XML数据:
<main_tag>
<x>
<a>name value</a>
<b>age value</b>
</x>
<y>
<c>country value</c>
<y>
</main_tag>
我希望上面的XML文件存储在HBase中。我们怎么做呢?
如果我有大量的XML文件,如何将文件批量加载到HBase中?
在这两种情况下,我最初都不想使用HDFS。
答案 0 :(得分:0)
你的第一个问题由@ravindra回答。对于第二个问题,您可以选择批量加载,您可以使用map reduce来读取大数据,并将其转换为HFile格式,然后使用bulk loading命令将map reduce的输出加载到Hbase。为此,由于map reduce从HDFS读取数据,因此您应该在HDFS中拥有大量数据。
这也取决于您的数据。查看here了解更多信息。