小蜂巢表有什么影响?

时间:2016-08-19 02:38:35

标签: hive

在我的一个用例中,有几个表是由一堆csv文件创建的。每个csv文件大约50-80MB。表配置为包含2个桶。表以ORC格式存储。但是,当我在hdfs的hive仓库目录中看到它时,它只有大约4 MB - 5MB。我已经将hive块大小从默认值降低到64MB。我担心的是,hdfs中的小文件会对Namenode施加压力。同样,小蜂巢表是一个问题吗?我还可以降低蜂巢块的大小吗?

0 个答案:

没有答案