我想知道如何压缩hadoop archive
的输出。目前,我得到的只是大小相同的输出,对我没有太大帮助,因为我正在寻找一种压缩源数据并将其保留一段时间的方法。这些数据采用XML文件的形式,并且实际上压缩得很好。
我想使用hadoop档案,因为我看到它是在针对问题Hadoop: compress file in HDFS?的答案之一中提出的
事实上,我想对这个问题使用其他答案,但是由于某种原因,有人很聪明,可以删除其他答案中提到的演示罐。 我现在正在考虑自己从Web上获取这些jar,但还是很想听到hadoop存档可用于压缩。
Thx