标签: hadoop mapreduce apache-pig
我在数据库系统中有数据,由于几个原因我无法使用LOAD语句。我需要Pig通过密钥(标识符)查找此数据,但是如果我实现Java UDF,我会担心逐个密钥查找的性能。基本上,如果我的关系上有10,000个条目,我想以某种方式以500个密钥的形式查找这些数据。 Pig是否提供了一个接口,允许我调用一个java方法,该方法将接受一组键并返回一组(包或地图)的答案,这些答案可以加入或以某种方式分配给Pig关系中的元组?
提前感谢您的帮助!
答案 0 :(得分:0)
一些建议: