Hadoop pig

时间:2015-08-28 00:44:10

标签: python hadoop apache-pig udf

我写了一个非常简单的Python,这里是我的UDF代码,猪代码和错误信息,任何想法有什么问题?感谢。

UDF(test.py),

@outputSchema("cookie:chararray")
def getSimple():
    return 'Hello'

猪码,

register test.py using jython as TestSimple;
a = TestSimple.getSimple() as word;

错误讯息

[main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: <line 1, column 0>  Syntax error, unexpected symbol at or near 'a'
提前谢谢, 林

1 个答案:

答案 0 :(得分:2)

您需要加载一些数据,而不是使用UDF处理它。 喜欢: 加载数据:

A = LOAD 'input' USING PigStorage('\t','-schema');

使用UDF处理您的数据,假设您的输入中有一个id字段:

B = FOREACH A GENERATE TestSimple.getSimple(id) as word;

当然,您需要正确注册UDF。