我在hive会话上运行聚合查询。
hive>select count(1) from table_name;
第一次运行mapreduce程序并返回结果。但是对于当天晚些时候的连续运行,它会从缓存中返回相同的计数(尽管表每小时更新一次)。这是错误计数。
尝试: -
set hive.metastore.aggregate.stats.cache.enabled=false
hive.cache.expr.evaluation=false
set hive.fetch.task.conversion=none
但没有运气。使用Hive 1.2.1.2.3.4.29-5
hive版本。感谢
答案 0 :(得分:2)
禁止使用统计信息进行查询计算:
set hive.compute.query.using.stats=false;
有关详细信息,请参阅此答案:https://stackoverflow.com/a/41021682/2700344