根据条件在apache pig中加入两个别名

时间:2015-05-29 09:09:20

标签: join apache-pig

我想加入两个别名/关系,

say A has keys : a,b,c
and B has keys : x,y,z

所以它应该是:

C = JOIN A by a, (IF B.x matches "foo.*" then pick y else z)

如上所述。我怎么能这样做?

1 个答案:

答案 0 :(得分:2)

我的回答:

只需根据条件生成一个密钥,然后通过该密钥加入

例如

<tbody>
    <tr>
        <td class="ms-vb2">
            <nobr>5/29/2015</nobr>    
        </td>
        <td class="ms-vb2">
            <a href="http://xxxx">ABCABCABC</a>
        </td>
    </tr>
    <tr class="ms-alternating">
        <td class="ms-vb2">
            <nobr>5/31/2015</nobr>
        </td>
        <td class="ms-vb2">
            <a href="http://yyyyyy">ABCABCABC</a>
        </td>
    </tr>
</tbody>