如何将外部创建的ORC文件加载到存储为ORC的HIVE表中?

时间:2016-04-14 11:20:04

标签: hadoop hive hdfs hiveql orc

我创建了一个托管的hive表,它存储为ORC,当加载.txt文件时,它的工作正常,但是无法将ORC文件加载到该表中。分隔符有什么关系吗?或者我错过了什么?

2 个答案:

答案 0 :(得分:1)

下面的代码对我有用,同时将HDFS中存在的ORC文件加载到配置单元表中。

  1. 在配置单元中创建一个表。

     create table MyDB.TEST (
     Col1 String,
     Col2 String,
     Col3 String,
     Col4 String)
     STORED AS INPUTFORMAT
           'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
     OUTPUTFORMAT
      'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat';
    
  2. 将数据加载到表格中。

     LOAD DATA INPATH '/hdfs/dir/folder/to/orc/files/' INTO TABLE MyDB.TEST;
    

答案 1 :(得分:0)

经过几次尝试,这是适合我的解决方案:

create table MyDB.TEST (
Col1 String,
Col2 String,
Col3 String,
Col4 String)
STORED AS ORC
LOCATION 'hdfs://hdfs/dir/folder/to/orc/files/';