如何在Pig脚本的foreach循环中运行存储并存储在HDFS中的特定路径中

时间:2016-05-27 11:07:36

标签: foreach apache-pig store multiple-value

我需要根据其组存储数据。 使用grouped = group events by (name,type);

当我描述分组时,我得到了这个:

{group: (name: chararray,type: chararray),events: {(eventDate: chararray, name: chararray,type: chararray)}}

例如每个组和元组:

  • {(" group1name,group1type&#34),(1,B,C),(2,F,E),(1,4,3)}
  • {(" group2name,group2type&#34),(2,d,E)}
  • {(" group3name,group3type&#34),(3,R,E),(4,S,E)}

所以我想存储 路径中的(1,b,c),(2,f,e),(1,4,3)" group1.name/group1.type/datafile ", (2,d,e)在路径" group2.name/group2.type/datafile "等等。 我怎么能这样做?

0 个答案:

没有答案