我尝试使用存储在hdfs中的文件创建一个配置单元orc表。
我有一个表“partsupp.tbl”文件,其中每一行都有以下格式:
1|25002|8076|993.49|ven ideas. quickly even packages print. pending multipliers must have to are fluff|
我创建了一个这样的hive表:
create table if not exists partsupp (PS_PARTKEY BIGINT,
PS_SUPPKEY BIGINT,
PS_AVAILQTY INT,
PS_SUPPLYCOST DOUBLE,
PS_COMMENT STRING)
STORED AS ORC TBLPROPERTIES ("orc.compress"="SNAPPY")
;
现在我试图在表格中加载.tbl文件中的数据,如下所示:
LOAD DATA LOCAL INPATH '/tables/partsupp/partsupp.tbl' INTO TABLE partsupp
但我得到了这个问题:
No files matching path file:/tables/partsupp/partsupp.tbl
但文件存在于hdfs ...
中答案 0 :(得分:2)
LOCAL
表示该文件存在于本地文件系统中。如果省略'LOCAL',则它在HDFS中查找文件。
所以在这种情况下,请使用以下查询:
LOAD DATA INPATH '/tables/partsupp/partsupp.tbl' INTO TABLE partsupp