Hive Metastore分区,它是如何工作的?

时间:2018-05-07 16:31:02

标签: hive partition metastore

我有几个问题,请帮助我理解

  1. 在Hive中,我看到几个hive表,群集和Metastore中的分区信息有什么不同可能是什么原因?
  2. 使用" hive>显示分区"在Hive和" SELECT * FROM PARTITIONS WHERE TBL_ID =;"在Metastore中。

    1. 对于某些hive表,我看到Cluster中的分区信息数量较少,但在Metastore中,它显示的是更多分区。对于这种类型的情况,当使用where子句为分区在hive表中运行查询时,它会给出错误,即某些分区缺失。
    2. 在某些hive表中,与集群相比,Metastore的分区信息数量较少,在这种情况下,查询在使用where子句中的分区运行查询时不会出错。

1 个答案:

答案 0 :(得分:1)

我想你正在使用Cloudera / Impala。文档说:如果您认为某个对象存在但您无法在SHOW输出中看到它,请与系统管理员联系,以确定是否需要为该对象授予新权限。 如果分区,表可以跨越多个不同的HDFS目录。这些目录可能会分散,因为分区可以根据其LOCATION属性驻留在任意HDFS目录中。

见这里:show partitions