1)我在Apache.Pig中加载了一个文件夹,没有定义为LINE的分隔符。 2)我使用过PYTHON udf来过滤给定的字符串。但是我得到了上面的错误。
REGISTER '/home/hadoop/alanGates/filter.py' using jython as filterfunction;
d = load '/home/hadoop/Desktop/' using PigStorage as line;
M = foreach d generate filterfunction.tuple_contains(line,Mariko);
任何人都可以找到这个错误并给我解决方案。