如何将XML数据导入Hadoop

时间:2015-12-23 14:46:45

标签: xml hadoop hdfs flume webhdfs

我对Hadoop很新,我想将半结构化数据 - XML导入HDFS。将XML数据从远程位置导入HDFS以及用于它的任何开源工具有哪些方法? Flume可以将XML数据导入HDFS吗?提前致谢

1 个答案:

答案 0 :(得分:1)

您可以尝试编写使用HDFS Java API在HDFS中创建文件,并在每个文件中写入XML的全部内容。

是的,如果从源中生成大量XML文件并希望沉入HDFS,您也可以使用水槽。

您可以查看以下链接: http://www.dummies.com/how-to/content/log-data-with-flume-in-hdfs.html