与emrfs的Hive

时间:2017-02-11 00:12:49

标签: hadoop hive amazon-emr

我正在使用sqoop将表从Amazon RDS导入到Hive。该过程正在运行,数据存储在hive默认的hdfs目录中:/ user / hive / warehouse。

我需要将存储位置从hdfs更改为emrfs s3。

据我了解,我需要将属性hive.metastore.warehouse.dir的值(在主节点上的hive-site.xml中)更改为s3 // bucket / warehouse-location。看来我没有权限修改文件hive-site.xml。

我正在寻找一些关于如何最好地做到这一点的建议。

苏迪

2 个答案:

答案 0 :(得分:1)

您需要sudo权限才能修改masternode上的hive-site.xml文件(通常位于/etc/hive/conf/hive-site.xml中)。

如果这不是一个选项,请尝试在启动群集之前设置此属性。 CloudFormation的一个示例:

                "Configurations" : [
                {
                    "Classification" : "hive-site",
                    "ConfigurationProperties" : {
                        "hive.metastore.warehouse.dir" : "s3://your_s3_bucket/hive_warehouse/",
                    }
                }
            ],

或通过"编辑软件设置"

部分中的EMR对话框

答案 1 :(得分:0)

sudo vi /etc/hive/conf/hive-site

sudo -su root
vi /etc/hive/conf/hive-site.xml