标签: hadoop hive google-cloud-platform hadoop2 google-cloud-dataproc
我在dataproc hadoop集群上有表,它已经包含数据并且它们是稳定的。
但是当我为它添加额外的分区并进行修复时,它仍然会给我一个旧状态的行数。
所以新的分区被添加到Metastore中,但仍然没有反映新的行数。
但是当我重新创建表然后修复时,会反映新的行数。
所以我执行的行计数查询没有使用Metastore统计数据,MR作业被用于行数。
提前致谢。