hive聚合查询从缓存

时间:2016-10-18 08:42:59

标签: mapreduce hive hiveql hadoop2

我在hive会话上运行聚合查询。

hive>select count(1) from table_name;

第一次运行mapreduce程序并返回结果。但是对于当天晚些时候的连续运行,它会从缓存中返回相同的计数(尽管表每小时更新一次)。这是错误计数。

尝试: -

set hive.metastore.aggregate.stats.cache.enabled=false

hive.cache.expr.evaluation=false

set hive.fetch.task.conversion=none

但没有运气。使用Hive 1.2.1.2.3.4.29-5 hive版本。感谢

1 个答案:

答案 0 :(得分:2)

禁止使用统计信息进行查询计算:

set hive.compute.query.using.stats=false;

有关详细信息,请参阅此答案:https://stackoverflow.com/a/41021682/2700344