我有以下格式的csv数据:
id,name,price,information
12,Pants,50.00,{Clothes & Shoes: 5}
这是我的猪脚本:
grunt> sample = LOAD 'data.csv' USING PigStorage (',') AS (id:int, name:chararray, price:double, information:chararray);
问题是,当我将信息加载为chararray时,因为我无法访问类别或数量本身。我试着做类似的事情:
information:tuple(category:chararray, quantity:int)
但它没有用......
我该怎么办? 加载信息的最佳方式是什么,这样我就可以访问类别和数量..
由于
答案 0 :(得分:0)
你所拥有的是一个Bag而不是一个元组。See here为Bag,Tuple。
()元组括在括号()中。
{}内袋用大括号{}包围。
您可以像这样加载
sample = LOAD 'data.csv' USING PigStorage (',') AS (id:int, name:chararray, price:double, information:bag{});