让我们说我们有一个外部Hive Metastore,然后我们有一堆Hadoop(HDInsight)集群,我们将在处理时根据需要删除和创建这些集群,这些集群正在使用此共享的Hive Metastore。在某个阶段,我们将在更新版本可用时开始使用更新版本的HDInsight创建这些群集。现在,假设在此过程中外部Metastore保持固定(将不会重新创建),那么它会为将来的HDInsight版本造成问题吗?还是每次我们开始使用新版本的HDInsight时,也必须将外部Metastore迁移到新版本吗? Hive Metastore和HDInsight群集之间的关系如何发挥作用?
通过Hive Metastore的“版本”,我的意思是-在某个时间点上,特定的外部Hive Metastore不存在,然后将创建第一个HDInsight(Hadoop)群集,并且将空SQL Server数据库实例在集群创建期间已指定。作为集群创建的一部分,托管Hive Metastore的数据库将被Hive元数据填充。因此,这就是我所说的Metastore的“版本”,它的版本可能与与要创建的特定HDInsight群集版本相关联的Hive组件的版本相同。
答案 0 :(得分:1)
注意:在针对现有的自定义元存储数据库创建新的更高版本的Azure HDInsight时,系统将升级元存储的架构,这是不可逆的,而无需从备份中还原数据库。 / p>
如果您在多个集群中共享一个元存储,请确保所有集群都是相同的HDInsight版本。不同的Hive版本使用不同的metastore数据库架构。例如,您不能在Hive 2.1和Hive 3.1版本的群集之间共享元存储。
有关更多详细信息,请参阅“ Hive metastore best practices”。
希望这会有所帮助。