有没有办法将.xlsx文件加载到Pig?我需要使用excel文件[.xlsx]作为输入在PIG中执行操作,但我找不到任何可用于此目的的内置函数。?
任何帮助实现这一目标都是值得的。
谢谢,
答案 0 :(得分:1)
试试这个,
首先将xlsx文件转换为csv,然后执行以下操作,
REGISTER Location\to\piggybank.jar
Data = load 'Location\to\csv\file' using org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'NOCHANGE', 'SKIP_INPUT_HEADER') as (col1,col2,..);
它(CSVExcelStorage)为我工作。希望它有效。
答案 1 :(得分:0)
不,但如果您的Excel只有一张,那么您可以尝试使用CSVExcelStorage
如何使用?检查以下链接中的猪示例
http://pig.apache.org/docs/r0.9.1/api/org/apache/pig/piggybank/storage/CSVExcelStorage.html