我正在尝试在HDFS上为Impala上传csv文件并且失败很多次。我不遵循指南,不知道这里有什么问题。而且csv也在HDFS上。
CREATE EXTERNAL TABLE gc_imp
(
asd INT,
full_name STRING,
sd_fd_date STRING,
ret INT,
ftyu INT,
qwerINT
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY','
LOCATION '/user/hadoop/Gc_4';
我得到的错误。我正在使用Hue。
> TExecuteStatementResp(status=TStatus(errorCode=None,
> errorMessage='MetaException: hdfs://nameservice1/user/hadoop/Gc_4 is
> not a directory or unable to create one', sqlState='HY000',
> infoMessages=None, statusCode=3), operationHandle=None)
任何领导。
答案 0 :(得分:8)
/user/hadoop/Gc_4
必须是目录。因此,您需要创建一个目录,例如/user/hadoop/Gc_4
。然后,您将Gc_4
上传到它。所以文件路径是/user/hadoop/Gc_4/Gc_4
。之后,您可以使用LOCATION
指定目录路径/user/hadoop/Gc_4
。
LOCATION
必须是目录。这个要求在Hive和Impala中是相同的。
答案 1 :(得分:1)
这不是答案,而是一种解决方法。
在大多数情况下,我已经看到上传的表格,但是"状态"没有成功。 此外,如果您在Hive的帮助下存储数据,这可以让您获得更多控制权,那么不要忘记刷新Impala UI上的元数据。" 。非常重要。