为Impala上传CSV

时间:2013-08-23 04:45:32

标签: csv hadoop hue impala

我正在尝试在HDFS上为Impala上传csv文件并且失败很多次。我不遵循指南,不知道这里有什么问题。而且csv也在HDFS上。

 CREATE EXTERNAL TABLE gc_imp 
                 (
                  asd INT,
                  full_name STRING,
                  sd_fd_date STRING,
                  ret INT,
                  ftyu INT,
                  qwerINT
                  ) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY','
LOCATION '/user/hadoop/Gc_4';

我得到的错误。我正在使用Hue。

> TExecuteStatementResp(status=TStatus(errorCode=None,
> errorMessage='MetaException: hdfs://nameservice1/user/hadoop/Gc_4 is
> not a directory or unable to create one', sqlState='HY000',
> infoMessages=None, statusCode=3), operationHandle=None)

任何领导。

2 个答案:

答案 0 :(得分:8)

/user/hadoop/Gc_4必须是目录。因此,您需要创建一个目录,例如/user/hadoop/Gc_4。然后,您将Gc_4上传到它。所以文件路径是/user/hadoop/Gc_4/Gc_4。之后,您可以使用LOCATION指定目录路径/user/hadoop/Gc_4

LOCATION必须是目录。这个要求在Hive和Impala中是相同的。

答案 1 :(得分:1)

这不是答案,而是一种解决方法。

在大多数情况下,我已经看到上传的表格,但是"状态"没有成功。 此外,如果您在Hive的帮助下存储数据,这可以让您获得更多控制权,那么不要忘记刷新Impala UI上的元数据。" 。非常重要。