蜂巢统计

时间:2014-07-22 17:25:22

标签: statistics hive

我正在尝试计算ORC文件的统计信息,但我在使用

时看不到PART_COL_STATS的任何更改
set hive.compute.query.using.stats=true;
set hive.stats.reliable=true;
set hive.stats.fetch.column.stats=true;
set hive.stats.fetch.partition.stats=true;
set hive.cbo.enable=true;

获取正在运行的列的最大值 我想要使​​用的是存储在元存储中的最大值,但我无法捕获这些统计信息。

我的表格desc 是:

load_inst_id int
src_filename string
server_date date

我的分析查询是:

analyze table mytable partition(server_date=’2013-11-30′) compute statistics for columns load_inst_id;

我总是将0作为loadinstant id,我必须关闭hive.compute.query.using.stats才能获得正确的结果(通过map reduce max(load_inst_id))

0 个答案:

没有答案