在Pig中将字段强制为Bag数据类型

时间:2012-09-28 19:08:49

标签: casting hadoop apache-pig

假设我在没有架构文件的情况下将其装入Pig。我知道包里的每个元组包含一个字段,也就是一个包,例如

{
  ({1, 2, 3}),
  ({3,4,5}),
  ({1,2})
}

我想将每个元组的第一个参数放入包中。我怎么能这样做?

data = LOAD '/path/to/data' AS (f:bytearray);
data2 = FOREACH data GENERATE (bag)f;  -- this doesn't work

1 个答案:

答案 0 :(得分:1)

data = LOAD '/path/to/data' AS (f:bag{(n:int)});