我使用Avro存储数据,我需要将其传递给Pig UDF。什么是正确的方法;
FOREACH
运营商将整条记录传递给UDF,理想情况下,如果我有存储在.avro文件中的MyRecord类型的记录,每个记录都包含字段A,B和C.我想将整个记录传递给UDF(扩展EvalFunc
)。在UDF中,我想要将元组转换为类型MyRecord
的记录(来自编译的Avro架构)。通过这种方式,我可以灵活地使用MyRecord.getA()
,MyRecord.getB()
和MyRecord.getC()
,并灵活地对所有三个字段进行操作。