APACHE-Pig脚本中的XML处理

时间:2017-04-13 13:19:44

标签: apache-pig

我有一个XML文件,其中包含一行数据(尽管包含所有开始和结束标记)。我尝试通过PIG脚本处理此文件,但输出仍为空。当我将其转换为正确的缩进文件时,我可以在输出syslog中看到输出。文件就像

<HEADER><TAG><VAL1>"value"</VAL1><VAL2>"value2"</VAL2></TAG></HEADER>

这可能吗

A =  LOAD 'test.xml' using org.apache.pig.piggybank.storage.XMLLoader('TAG') as (x:chararray);
DESCRIBE A;

B = foreach A GENERATE FLATTEN(REGEX_EXTRACT_ALL(x,<TAG>\\*s<VAL1>(.*)</VAL1>\\s*<VAL2>(.*)</VAL2></TAG>))
As 
val1:chararray,
val2:chararray)
dump B;

0 个答案:

没有答案