我正在尝试计算ORC文件的统计信息,但我在使用
时看不到PART_COL_STATS的任何更改set hive.compute.query.using.stats=true;
set hive.stats.reliable=true;
set hive.stats.fetch.column.stats=true;
set hive.stats.fetch.partition.stats=true;
set hive.cbo.enable=true;
获取正在运行的列的最大值 我想要使用的是存储在元存储中的最大值,但我无法捕获这些统计信息。
我的表格desc 是:
load_inst_id int
src_filename string
server_date date
我的分析查询是:
analyze table mytable partition(server_date=’2013-11-30′) compute statistics for columns load_inst_id;
我总是将0作为loadinstant id,我必须关闭hive.compute.query.using.stats
才能获得正确的结果(通过map reduce max(load_inst_id))