我有一个XML文件,其中包含一行数据(尽管包含所有开始和结束标记)。我尝试通过PIG脚本处理此文件,但输出仍为空。当我将其转换为正确的缩进文件时,我可以在输出syslog中看到输出。文件就像
<HEADER><TAG><VAL1>"value"</VAL1><VAL2>"value2"</VAL2></TAG></HEADER>
这可能吗
A = LOAD 'test.xml' using org.apache.pig.piggybank.storage.XMLLoader('TAG') as (x:chararray);
DESCRIBE A;
B = foreach A GENERATE FLATTEN(REGEX_EXTRACT_ALL(x,<TAG>\\*s<VAL1>(.*)</VAL1>\\s*<VAL2>(.*)</VAL2></TAG>))
As
val1:chararray,
val2:chararray)
dump B;