使用ORC Serde时配置单元中创建表属性的差异

时间:2018-09-24 07:49:30

标签: hadoop hive hiveql

下面是现有配置单元表之一的结构。

CREATE TABLE `tablename`(
col1 datatype,
col2 datatype,
col3 datatype)
partitioned by (col3 datatype)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
WITH SERDEPROPERTIES (
  'field.delim'='T',
  'serialization.format'='T')
STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION
  'maprfs:/file/location'
TBLPROPERTIES (
  'COLUMN_STATS_ACCURATE'='{\"BASIC_STATS\":\"true\"}',
  'numFiles'='0',
  'numRows'='0',
  'rawDataSize'='0',
  'totalSize'='0',
  'transient_lastDdlTime'='1536752440')

现在我想创建一个具有相同属性的表,如何在创建表语法中定义以下属性。

  

字段定界符和序列化格式   TBLPROPERTIES用于存储numFiles,numRows,radDataSize,totalSize(以及我们可以在TBLPROPERTIES选项中存储的所有其他信息)

下面是我使用过的创建表语法之一

 create table test_orc_load (a int, b int) partitioned by (c int) stored as ORC;

我使用show create table选项获得的表属性。

CREATE TABLE `test_orc_load`(
  `a` int,
  `b` int)
PARTITIONED BY (
  `c` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION
  'maprfs:/user/hive/warehouse/alb_supply_chain.db/test_orc_load'
TBLPROPERTIES (
  'transient_lastDdlTime'='1537774167')

0 个答案:

没有答案