Hadoop用于处理大数据,hadoop使用HBase作为其数据库,但是BigData可能有80%是非结构化的,而HBase仅存储结构化数据。
非结构化数据将存储在哪里?还是有hadoop的任何工具将非结构化数据转换为结构化格式?
答案 0 :(得分:0)
“大数据”并不意味着存在任何结构,但是大多数数据集都是半结构化的,否则将很难一致地进行解析。
HBase位于HDFS之上。而且Hbase可以存储二进制blob,因此其数据可用于存储非结构化数据。
HDFS可以存储任何类型的数据。它没有有关文件内容的元数据
通常,您使用Hive(MetaStore)来应用HDFS数据集的结构