PIG Latin:基于字段值的输出路径

时间:2013-12-12 08:39:01

标签: hadoop apache-pig

我有一个日志文件,其中包含来自多个域的日志。现在我想对它们进行一些分析,并将输出存储在名为domain的目录中。我在我的日志中将域作为字段值:

STORE outputlogs INTO 'testpath/DOMAIN/logs USING....

这可能吗?或者我只能将输出存储在硬编码文件路径中吗?

1 个答案:

答案 0 :(得分:1)

如果域名是outputlogs中的字段,那么您可以使用来自piggybank的MultiStorage。类似的东西:

STORE outputlogs INTO 'testpath/DOMAIN/logs' 
                 USING MultiStorage('testpath/DOMAIN/logs','0') ;

其中0是域的位置字段。