我是猪的新手。我在处理XML文件时遇到了问题,下面的命令就是我用过的:
register '/usr/lib/pig-0.12.0/contrib/piggybank/java/piggybank.jar'
pigdata = load '/xml1.xml' using org.apache.pig.piggybank.storage.XMLLoader('name') as (doc:chararray);
values = foreach pigdata GENERATE FLATTEN(REGEX_EXTRACT_ALL(doc,'<name>(.*)</name>')) AS (name:chararray);
dump values;
答案 0 :(得分:0)
此问题可能是由于文件路径问题和/或权限问题引起的。可以请检查/user/edureka/xml1.xml中是否存在输入文件的hdfs文件路径。您还可以手动检查是否能够在hdfs:// localhost:8020 / tmp目录等中创建新文件以排除权限问题。