找出原始的镶木地板文件大小?

时间:2015-11-19 20:27:00

标签: hadoop parquet

有没有办法弄清楚在snappy中压缩的拼花文件的未压缩文件大小是多少?我在HDFS目录中有很多镶木地板文件,我试图找出是否有办法计算文件大小,如果该数据是未压缩的。

1 个答案:

答案 0 :(得分:0)

您可以尝试解压缩数据并查看其消耗的空间。见How to decompress the hadoop reduce output file end with snappy?

也许有一种我不知道的更优雅的方式