我正在调试一个猪脚本。我想直接在Pig文件中定义一个元组(而不是基本的“加载”函数)。
有办法吗?
我正在寻找类似的东西:
A= ('name#bob'','age#29';'name#paul','age#12')
转储将返回:
('bob',29)
('paul',12)
答案 0 :(得分:4)
事实上,猪在目前的情况下这样做是不可能的。如果你只想调试在hadoop中创建一个文件并加载它。将您想要的数据写入文件(无论您手动创建的是什么)都可以上传。然后用猪装载它。
答案 1 :(得分:1)
以下(脏)技巧完成工作: - 创建一个文件,其中一行为空,并将其存储到HDFS中。 - 加载它:Line = load / user / toto / onelinefile USING .. - 创建自己的数据:foreach行生成'bob'作为名称,22作为年龄;