Apache Pig中的联合功能

时间:2014-07-26 09:53:11

标签: apache-pig

如果我们有两个不同大小的关系

,我想知道UNION运算符是如何工作的

比如说,我有两个文件,如下面的

文件a.txt在

之下
232,surender
262,ranjith

文件b.txt在

下面
100,kumar,chennai
200,dhiv,chennai

我的猪脚本是

A = LOAD 'a.txt' USING PigStorage(',') AS(id:int,name:chararray);
B = LOAD 'b.txt' USING PigStorage(',') AS(id:int,name:chararray,city:chararray);
C = UNION A,B;
dump C;

现在问题出在我的输出中我是否得到三个原子或两个原子? 我只得到两个原子。为什么它显示两个原子。城市场地错过了。 请有人就此解释一下。

我需要输出

(232,surender,,)
(262,ranjith,,)
(100,kumar,chennai)
(200,dhiv,chennai)

请帮忙

1 个答案:

答案 0 :(得分:0)

您可能希望以下列方式加载文件a.txt

A = LOAD' a.txt'使用PigStorage(',')AS(id:int,name:chararray,city:chararray);