任何人都知道如何使用分区查询来自Hive托管表的ORC分区表插入。我没有这样做。甚至在为HIVE ORC表插入新分区后,我无法使用SELECT和WHERE查询...!
下面是我的查询详情:
>DROP TABLE IF EXISTS mydb.loan_orc;
>CREATE TABLE mydb.loan_orc
(<NON PARTITION COLUMNS DEFINITION>)
PARTITIONED BY(<PARTITION COLUMNS DEFINITION>)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
stored AS orc tblproperties ("orc.compress"="NONE","orc.stripe.size"="67108864","orc.row.index.stride"="25000");
>INSERT INTO TABLE mydb.loan_orc
PARTITION (<PARTITION COLUMNS>)
SELECT <NON PARTITION COLUMNS>
FROM mydb.loan WHERE <PARTITION COLUMN CONDITIONS>;
loan表是loan_orc的副本,但唯一不同的是Non ORC和ORC之间的存储格式。!
答案 0 :(得分:0)
通过执行以下查询,我的问题得到解决。
set hive.support.quoted.identifiers = none;
INSERT INTO TABLE mydb.loan_orc PARTITION(=&#39;&#39;,=&#39;&#39;,=&#39;&#39;)选择
(<partcol1>|<partcol2>|<partcol3>)?+.+
FROM mydb。贷款在哪里=&#39;&#39; AND =&#39;&#39; AND =&#39;&#39;限制10;