无法使用Apache Pig加载数据

时间:2016-09-10 02:48:58

标签: apache-pig

我有以下格式的csv数据:

id,name,price,information
12,Pants,50.00,{Clothes & Shoes: 5}

这是我的猪脚本:

grunt> sample = LOAD 'data.csv' USING PigStorage (',') AS (id:int, name:chararray, price:double, information:chararray);

问题是,当我将信息加载为chararray时,因为我无法访问类别或数量本身。我试着做类似的事情:

information:tuple(category:chararray, quantity:int)

但它没有用......

我该怎么办? 加载信息的最佳方式是什么,这样我就可以访问类别和数量..

由于

1 个答案:

答案 0 :(得分:0)

你所拥有的是一个Bag而不是一个元组。See here为Bag,Tuple。

()元组括在括号()中。

{}内袋用大括号{}包围。

您可以像这样加载

sample = LOAD 'data.csv' USING PigStorage (',') AS (id:int, name:chararray, price:double, information:bag{});