Hive版本2.3
SET hive.exec.compress.output=true;
CREATED TABLE (
*) STORED AS PARQUET
LOCATION 's3 location'
TBLPROPERTIES ('parquet.compress'='SNAPPY');
我上面做了但s3位置的表输出没有压缩,我能用cat看到结果,我也试过'TBLPROPERTIES('PARQUET.COMPRESS'='ZLIB');'这也没用。有谁知道使用蜂巢压缩实木复合地板的最佳方法是什么?谢谢。
答案 0 :(得分:0)
SET hive.exec.compress.output=true;
SET mapred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec;
SET mapred.output.compression.type=BLOCK;
CREATED TABLE (*) STORED AS PARQUET LOCATION 's3 location';
您还可以设置其他压缩格式。压缩列表
从上面的列表中,Snappy不是默认值,DeflateCodec是默认值。 您可以通过运行
来确认hive> SET mapred.output.compression.codec;