如何在Dataproc群集中为Hive 2.1.0启用LLAP?

时间:2019-04-17 07:20:27

标签: hive google-cloud-dataproc

我正在尝试为Hive 2.1.0(与Google Cloud Dataproc一起提供)设置LLAP(交互式查询)。我已经启用了Tez作为执行引擎,但是我找不到用于启用LLAP来使Hive更快的任何文档/步骤。可用的大多数用于Hortonworks集群,这是通过Ambari完成的。

2 个答案:

答案 0 :(得分:1)

我认为您可以在创建集群时遵循Hive Configuration Properties - LLAP添加以下属性。

--properties 'hive:hive.llap.execution.mode=<mode>,hive:hive.server2.llap.concurrent.queries=<n>,...'

请注意,Dataproc要将属性吸收到Hive中,必须使用“ hive:”前缀。

答案 1 :(得分:0)

根据本文档using apache hive on cloud dataprocCloud SQL I/O and Hive Metastore



gcloud dataproc clusters create hive-cluster \
    --scopes sql-admin \
    --image-version 1.3 \
    --initialization-actions gs://dataproc-initialization-actions/cloud-sql-proxy/cloud-sql-proxy.sh \
    --properties 'hive:hive.metastore.warehouse.dir=gs://$PROJECT-warehouse/datasets,hive:hive.llap.execution.mode=<mode>,hive:hive.server2.llap.concurrent.queries=<n>' \
    --metadata "hive-metastore-instance=<PROJECT_ID>:<REGION>:<INSTANCE_NAME>" 

如果需要设置任何配置单元配置(hive-site.xml),只需在属性中添加hive:xxx。

相关问题