当使用datameer,presto和spark等工具时,哪种压缩技术效果更好

时间:2017-11-26 04:42:10

标签: gzip bzip2 snappy

我们正在努力选择更好的压缩技术。我们尝试使用 bzip2 ,但花费更多时间进行压缩

1 个答案:

答案 0 :(得分:0)

我认为你的问题没有直接答案。什么会更好或更好取决于您的基础设施,要求和数据流。

您可以查看" Performance comparison of different file formats and storage engines in the Hadoop ecosystem"或" Hadoop Compression. Choosing compression codec."。

从速度的角度来看,Snappy可能是一个不错的尝试。