我正在Amazone EMR中运行一个小型集群,以便与Apache Hive 2.3.5一起玩。据我了解,Apache Hive可以从远程数据库导入数据,并使群集运行查询。我正在遵循Apache Hive网站文档(https://cwiki.apache.org/confluence/display/Hive/JdbcStorageHandler)中提供的示例,并创建了以下代码:
CREATE EXTERNAL TABLE hive_table
(
col1 int,
col2 string,
col3 date
)
STORED BY 'org.apache.hive.storage.jdbc.JdbcStorageHandler'
TBLPROPERTIES (
'hive.sql.database.type'='POSTGRES',
'hive.sql.jdbc.driver'='org.postgresql.Driver',
'hive.sql.jdbc.url'='jdbc:postgresql://<url>/<dbname>',
'hive.sql.dbcp.username'='<username>',
'hive.sql.dbcp.password'='<password>',
'hive.sql.table'='<dbtable>',
'hive.sql.dbcp.maxActive'='1'
);
但是出现以下错误:
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. java.lang.RuntimeException: MetaException(message:org.apache.hadoop.hive.serde2.SerDeException java.lang.IllegalArgumentException: Property hive.sql.query is required.)
根据文档,我需要指定“ hive.sql.table”或“ hive.sql.query”以告诉如何从jdbc数据库获取数据。但是,如果我将hive.sql.table替换为hive.sql.query,则会出现以下错误:
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. java.lang.RuntimeException: MetaException(message:org.apache.hadoop.hive.serde2.SerDeException java.lang.IllegalArgumentException: No enum constant org.apache.hive.storage.jdbc.conf.DatabaseType.POSTGRES)
我尝试在网络上寻找解决方案,但似乎没有人遇到与我同样的问题。我需要修改配置文件还是我的代码中缺少重要内容?
答案 0 :(得分:1)
我认为您使用的是不支持POSTGRES的jar版本。
从此链接下载最新的jar: http://repo1.maven.org/maven2/org/apache/hive/hive-jdbc-handler/3.1.2/hive-jdbc-handler-3.1.2.jar
将此下载的jar放入hdfs位置。