标签: hive
在我的一个用例中,有几个表是由一堆csv文件创建的。每个csv文件大约50-80MB。表配置为包含2个桶。表以ORC格式存储。但是,当我在hdfs的hive仓库目录中看到它时,它只有大约4 MB - 5MB。我已经将hive块大小从默认值降低到64MB。我担心的是,hdfs中的小文件会对Namenode施加压力。同样,小蜂巢表是一个问题吗?我还可以降低蜂巢块的大小吗?