标签: hadoop parquet
有没有办法弄清楚在snappy中压缩的拼花文件的未压缩文件大小是多少?我在HDFS目录中有很多镶木地板文件,我试图找出是否有办法计算文件大小,如果该数据是未压缩的。
答案 0 :(得分:0)
您可以尝试解压缩数据并查看其消耗的空间。见How to decompress the hadoop reduce output file end with snappy?
也许有一种我不知道的更优雅的方式