如何使用apache pig

时间:2017-01-30 18:30:16

标签: java linux mapreduce apache-pig

我使用sample.gz文件进行分析,sample.gz文件包含多个文件。为了提取目的,我将这个文件加载到pig关系中,我能够读取文件,但现在只有单个文件以part-m *的形式出现。我想将此文件拆分为多个文件。有谁能够帮我 ?感谢

脚本: -

A = LOAD 'sample.gz';
STORE A into 'B'; 

这里,sample.gz文件包含多个文件,如file1.txt,file2.txt,file3.txt,但在使用pig存储之后,所有文件都已合并到一个文件中。我想分开所有文件。

0 个答案:

没有答案