如何在PIG中将XLSX文件转换为CSV文件?

时间:2016-09-09 08:46:14

标签: csv hadoop apache-pig xlsx apache-pig-grunt

我们如何使用PIG SCRIPT将covert a xlsx文件归档到csv文件。 我发现有CSVExcelStorage将alredy转换后的xlsx存储到csv文件。

STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,{'YES_MULTILINE' | 'NO_MULTILINE'} [,{'UNIX' | 'WINDOWS' | 'UNCHANGED'}]]]);
Eg:

STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');

我认为在此之前我们需要将xlsx文件转换为csv。

那么我们怎样才能使用猪。

任何帮助。

1 个答案:

答案 0 :(得分:-1)

参考:CSVExcelStorage

用法:

STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,{'YES_MULTILINE' | 'NO_MULTILINE'} [,{'UNIX' | 'WINDOWS' | 'UNCHANGED'}]]]);

例如:

STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');

其中CRLF是换行符(0x0d 0x0a:\ r \ n),逗号是字段分隔符。