我正在尝试在PIG中加载以下数据。 (3,8,9)(4,5,6) (1,4,7)(3,7,5) (2,5,8)(9,5,8)
A = LOAD 'data' AS (t1:tuple(t1a:int, t1b:int,t1c:int),t2:tuple(t2a:int,t2b:int,t2c:int));
在转储时,仅获得第一个元组,为什么另一个元组不显示。请帮忙。
dump A;
((3,8,9),)
((1,4,7),)
((2,5,8),)
答案 0 :(得分:0)
LOAD
默认情况下需要制表符分隔的数据。参考:http://pig.apache.org/docs/latest/func.html#pigstorage。您的输入数据可能具有用空格分隔的元组,因此第二行在每一行中都丢失了。
答案 1 :(得分:0)
尝试使用A = LOAD 'data' AS (t1:tuple(t1a:int, t1b:int,t1c:int),t2:tuple(t2a:int,t2b:int,t2c:int)) USING PigStorage(',');