基于蜂巢中每种文件格式的方案

时间:2019-04-08 01:20:59

标签: hadoop

Hadoop的新功能。刚刚学习参加面试。采访中有人问了一些问题,例如,表格的大小是多少,以及表格的基本文件格式是什么?有多少行等等。这无法使面试官满意。请让我知道有关Hadoop中文件格式的所有方案。

1 个答案:

答案 0 :(得分:0)

配置单元不会告诉您表的大小。您需要总结由表组成的HDFS目录。

您可以通过描述表格来找到表格的格式。如果您知道Hive,则应该了解此命令使用的命令。

类似地,HiveQL具有一个count SQL运算符,用于获取行数。文件格式无关紧要