使用HIVE外部表读取多个目录

时间:2016-09-15 04:58:12

标签: hive

我在HDFS中有一个目录(例如/ user / hduser / table1),在该目录下有多个目录用于不同的时间戳,如jdbc:sqlanywhere:Server=yourservername;uid=user;pwd=xxxx;port=2638;eng=xx_sql;database=dummy;links=tcpip(port=2638) def on_press(self,instance): return LoginScreen() # will not do anything like you expected* /user/hduser/table1/20160912000000

如何通过一个HIVE外部表读取这三个目录下的所有文件。意味着我必须在HIVE表的LOCATION参数中指定。

2 个答案:

答案 0 :(得分:1)

我可以使用以下设置读取嵌套文件夹。

set hive.mapred.supports.subdirectories=true;
set mapred.input.dir.recursive=true;

我在创建表时设置了它,然后能够从表中选择数据。我在下面提到的位置关键字

LOCATION '/user/hduser/table1/'

答案 1 :(得分:0)

尝试以下代码

CREATE TABLE TABLEname  (coll INT, coll STRING, coll INT)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘,’
LOCATION ‘/user/hduser/table1/*/*’;