无法使用jdbcStorageHandler创建Hive外部表

时间:2019-09-25 23:15:00

标签: hadoop hive

我正在Amazone EMR中运行一个小型集群,以便与Apache Hive 2.3.5一起玩。据我了解,Apache Hive可以从远程数据库导入数据,并使群集运行查询。我正在遵循Apache Hive网站文档(https://cwiki.apache.org/confluence/display/Hive/JdbcStorageHandler)中提供的示例,并创建了以下代码:

CREATE EXTERNAL TABLE hive_table
(
  col1 int,
  col2 string,
  col3 date
)
STORED BY 'org.apache.hive.storage.jdbc.JdbcStorageHandler'
TBLPROPERTIES (
    'hive.sql.database.type'='POSTGRES',
    'hive.sql.jdbc.driver'='org.postgresql.Driver',
    'hive.sql.jdbc.url'='jdbc:postgresql://<url>/<dbname>',
    'hive.sql.dbcp.username'='<username>',
    'hive.sql.dbcp.password'='<password>',
    'hive.sql.table'='<dbtable>',
    'hive.sql.dbcp.maxActive'='1'
);

但是出现以下错误:

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. java.lang.RuntimeException: MetaException(message:org.apache.hadoop.hive.serde2.SerDeException java.lang.IllegalArgumentException: Property hive.sql.query is required.)

根据文档,我需要指定“ hive.sql.table”或“ hive.sql.query”以告诉如何从jdbc数据库获取数据。但是,如果我将hive.sql.table替换为hive.sql.query,则会出现以下错误:

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. java.lang.RuntimeException: MetaException(message:org.apache.hadoop.hive.serde2.SerDeException java.lang.IllegalArgumentException: No enum constant org.apache.hive.storage.jdbc.conf.DatabaseType.POSTGRES)

我尝试在网络上寻找解决方案,但似乎没有人遇到与我同样的问题。我需要修改配置文件还是我的代码中缺少重要内容?

1 个答案:

答案 0 :(得分:1)

我认为您使用的是不支持POSTGRES的jar版本。

  1. 从此链接下载最新的jar: http://repo1.maven.org/maven2/org/apache/hive/hive-jdbc-handler/3.1.2/hive-jdbc-handler-3.1.2.jar

  2. 将此下载的jar放入hdfs位置。

  3. 正常运行配置单元。
  4. 运行命令:添加jar $ {HDFS_PATH_TO_DOWNLOADED_JAR}
  5. 运行创建表命令