将多个包分成多个元组的元组

时间:2013-11-27 05:31:46

标签: apache-pig

我的数据为:

{(2000),(1800),(2700)} {(2014),(1500),(1900)}等 我创建了一个java UDF:

DataBag bag = (DataBag)input.get(0);

    Tuple categoryCode = null; 
    Tuple auxiliary = TupleFactory.getInstance().newTuple(3);

    int i = 0;
    for(Iterator<Tuple> code=bag.iterator(); code.hasNext();) {
        categoryCode=code.next();
        auxiliary.set(i, categoryCode.get(0).toString());
        i+=1;
    }

    return auxiliary.toDelimitedString(",");

我希望我的输出在不同的列中如下所示:

2000 1800 2700 2014 1500 1900等 我的UDF输出为:

2000,1800,2700 2014,1500,1900等单列 请帮助是否有其他解决方案。请帮助您提供意见。

1 个答案:

答案 0 :(得分:0)

您可以按原样返回元组,并在猪脚本中展平。