我正在hive控制台中执行以下命令。
create table departments_parquet stored as parquet tblproperties("parquet.compression"="GZIP") as select * from departments;
我看到以镶木地板格式创建的输出文件如下所示。
-rwxrwxrwx 1 cloudera supergroup 463 2017-06-17 14:55 /user/hive/warehouse/departments_parquet/000000_0
Hive相关属性设置为:
mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
hive.exec.compress.output=true;
我希望输出文件名为000000_0.gz 请帮助将最终输出作为压缩gzip文件。 感谢。
答案 0 :(得分:0)
列式存储同时使用各种压缩技术,页面压缩只是其中之一,因此,虽然包含gzip压缩数据部分,但文件不是gzip压缩文件。