在使用Load数据流步骤时,使用(使用PigStorage)并使用它时有什么不同?
想知道以下步骤之间的区别。
movie2 = load 'movie/part-m-00000' as (mid:int, mname:chararray, myr:int);
movie2 = load 'movie/part-m-00000' using PigStorage(',') as (mid:int, mname:chararray, myr:int);
答案 0 :(得分:0)
默认使用PigStorage,它是一个文本文件,其中字段由分隔符分隔,制表符作为分隔符。
指定using PigStorage(',')
会将分隔符更改为逗号。
答案 1 :(得分:0)
添加回答rsp,使用PigStorage有两个优点
指定文件分隔符的选项
加载输入模式的选项。
此处有更多详情:http://pig.apache.org/docs/r0.10.0/api/org/apache/pig/builtin/PigStorage.html