我有800K gz文件,这些文件的文件名是这样的:
000e31ec-BB1B-42af-80c9-97635ae75cb2
他们没有.gz
扩展名,但绝对是gz文件:
017-06-14/000e31ec-bb1b-42af-80c9-97635ae75cb2: gzip compressed data, was "000e31ec-bb1b-42af-80c9-97635ae75cb2", last modified: Tue Jun 13 06:22:33 2017, max compression
我想将这些800K文件减少到不会破坏我的Spark群集的东西,比如800个文件。显然zcat不能直接在文件上工作,因为它们没有.gz
扩展名。有什么想法吗?