我正在运行Hive 1.0,尝试使用内置的analyze
命令计算列统计信息。 HQL脚本如下所示:
set hive.cbo.enable=true;
set hive.compute.query.using.stats=true;
set hive.stats.fetch.column.stats=true;
use db;
analyze table tbl compute statistics for columns;
按预期启动仅限地图的MR任务。对于map和reduce,作业运行到100%,然后报告:
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.ColumnStatsTask
但是这份工作被注册为SUCCESS
。
谷歌搜索引导我this JIRA ticket,但决议说问题已在Hive 0.14中解决。在查询中是否有一些简单的东西?