将xlsx文件加载到Pig中

时间:2014-08-20 08:43:42

标签: apache-pig

有没有办法将.xlsx文件加载到Pig?我需要使用excel文件[.xlsx]作为输入在PIG中执行操作,但我找不到任何可用于此目的的内置函数。?

任何帮助实现这一目标都是值得的。

谢谢,

2 个答案:

答案 0 :(得分:1)

试试这个,

首先将xlsx文件转换为csv,然后执行以下操作,

REGISTER Location\to\piggybank.jar

Data = load 'Location\to\csv\file' using org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'NOCHANGE', 'SKIP_INPUT_HEADER') as (col1,col2,..);

它(CSVExcelStorage)为我工作。希望它有效。

答案 1 :(得分:0)

不,但如果您的Excel只有一张,那么您可以尝试使用CSVExcelStorage

如何使用?检查以下链接中的猪示例

http://pig.apache.org/docs/r0.9.1/api/org/apache/pig/piggybank/storage/CSVExcelStorage.html