Hive外部表 - 使用包含不同记录数的新文件替换基础数据文件后未给出正确的计数

时间:2016-09-20 05:11:02

标签: hadoop hive

注意到count(*)在替换现有数据文件后,在外部表的HDFS位置中没有给出包含不同记录数的新文件的更新计数。

有没有办法刷新这个值?或者,它会在可配置的持续时间后自动刷新吗?

1 个答案:

答案 0 :(得分:3)

Hive维护一些表统计信息的缓存,包括行数。尝试执行ANALYZE TABLE tablename COMPUTE STATISTICS更新这些缓存的统计信息并再次运行查询。有关详细信息,请参阅Statistics in Hive