元组未在PIG中显示正确的数据

时间:2018-07-31 07:29:08

标签: hadoop apache-pig

我正在尝试在PIG中加载以下数据。     (3,8,9)(4,5,6)     (1,4,7)(3,7,5)     (2,5,8)(9,5,8)

A = LOAD 'data' AS (t1:tuple(t1a:int, t1b:int,t1c:int),t2:tuple(t2a:int,t2b:int,t2c:int));

在转储时,仅获得第一个元组,为什么另一个元组不显示。请帮忙。

dump A;

((3,8,9),)
((1,4,7),)
((2,5,8),)

2 个答案:

答案 0 :(得分:0)

Pig中的

LOAD默认情况下需要制表符分隔的数据。参考:http://pig.apache.org/docs/latest/func.html#pigstorage。您的输入数据可能具有用空格分隔的元组,因此第二行在每一行中都丢失了。

答案 1 :(得分:0)

尝试使用A = LOAD 'data' AS (t1:tuple(t1a:int, t1b:int,t1c:int),t2:tuple(t2a:int,t2b:int,t2c:int)) USING PigStorage(',');