输出配置单元导致镶木地板格式文件

时间:2015-11-18 17:00:17

标签: hadoop hive parquet

您可以将配置单元查询结果导出为拼花文件格式吗?我可以将结果导出为这样的tsv:

INSERT OVERWRITE DIRECTORY '/home/user/events'
row format delimited 
fields terminated by '\t'

但我怎么告诉它以镶木地板的形式呢?

3 个答案:

答案 0 :(得分:4)

从SOU​​RCE_TABLE_NAME插入覆盖目录'EXTERNAL_DIRECTORY'STORED AS PARQUET select *;

答案 1 :(得分:1)

使用以下方法

  

创建表parque_table(

     

)行格式SERDE' parquet.hive.serde.ParquetHiveSerDe'存储为   INPUTFORMAT" parquet.hive.DeprecatedParquetInputFormat"             OUTPUTFORMAT" parquet.hive.DeprecatedParquetOutputFormat" LOCATION' $ {hiveconf:hive_location}';

     

INSERT OVERWRITE TABLE parque_table select from othertable

答案 2 :(得分:0)

首先,你需要在hive 存储为镶木地板中创建一个包含结果架构的表格。获得结果后,您可以将它们导出到镶木地板文件格式表中,如下所示

insert into table parquet_file_table_name select * from table_name_containing_results

有关详细信息,请参阅以下链接

https://acadgild.com/blog/parquet-file-format-hadoop/