当我在现有表格中加载新数据然后执行select count(1)
以获取加载的总行数时,我只获得一个HDFS文件的计数。
行号仅表示一个HDFS文件的数量。
你知道我做错了什么吗?
问候!
答案 0 :(得分:1)
试试这个:
invalidate metadata default.movie;
很可能您使用Impala作为引擎来检索数据,此命令是重新加载元数据。
默认情况下,刷新所有表的缓存元数据。如果你 指定表名,只刷新该表的元数据。 即使对于单个表,INVALIDATE METADATA也比它更贵 REFRESH,所以在添加新数据的常见情况下更喜欢REFRESH 现有表格的文件。
如果你想更进一步,check this out.