是否有内置机制将额外元数据标记为HDFS文件并根据标记信息检索文件?假设我想在数据中添加企业级信息,是否可以在Hadoop中使用,或者我们是否需要其他框架
答案 0 :(得分:0)
这可能对您有用
QueryIO提供高级手动和自动数据标记功能,允许您在文件写入HDFS时定义文件的属性。它自动存储存储在HDFS中的基本MetaData文件,并通过使您能够定义其他MetaData进一步扩展MetaData层。它了解数十种文件格式,如pdf / xls / doc文件格式,图像文件,音频和视频文件等。
http://www.slideshare.net/QueryIO/hadoop-data-tagging-and-metadata-extension