镶木地板输出文件未压缩

时间:2017-06-17 22:11:56

标签: hive

我正在hive控制台中执行以下命令。

create table departments_parquet stored as parquet tblproperties("parquet.compression"="GZIP") as select * from departments;

我看到以镶木地板格式创建的输出文件如下所示。

-rwxrwxrwx   1 cloudera supergroup        463 2017-06-17 14:55 /user/hive/warehouse/departments_parquet/000000_0

Hive相关属性设置为:

mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
hive.exec.compress.output=true;

我希望输出文件名为000000_0.gz 请帮助将最终输出作为压缩gzip文件。 感谢。

1 个答案:

答案 0 :(得分:0)

列式存储同时使用各种压缩技术,页面压缩只是其中之一,因此,虽然包含gzip压缩数据部分,但文件不是gzip压缩文件。