标签: hive parquet orc
我有一个配置单元,其中包含拼花格式的文件。 列的数据类型之一是map。当我在拼花普通列上查询时,由于它的列格式,因此只会获得具有列值的行,因为它在该列上具有索引。
但是当我查询嵌套列的键时,我可以获得同样的优势吗? 说出地图属性。包含一个键key1,其值为v1。 现在,当我查询时-从attr ['key1'] ='v1'的表中选择count(1)。它会扫描整行还是只扫描attr ['key1']为v1的行?
对于地图列,镶木地板或ORC哪个更好?
谢谢