Hadoop初学者 - 数据摄取&分析

时间:2017-12-18 09:16:56

标签: hadoop hive impala

HDFS存储结构化和&非结构化数据.HIVE& IMPALA使我们能够编写SQL查询,然后将其转换为MapReduce。用户如何了解存储数据的模式或如何根据存储在HDFS中的数据形成这些表?

1 个答案:

答案 0 :(得分:0)

如果使用Parquet文件格式,则可以使用工具直接检查文件块。例如,请参阅this。大多数hadoop文件格式也有类似的方便工具,例如orcfiles的https://orc.apache.org/docs/tools.html