在本地模式下运行猪

时间:2013-03-16 07:49:57

标签: hdfs apache-pig

我是APACHE PIG的初学者,以下是我的轻微混淆

我正在尝试使用本地模式运行pig 猪-x本地。

现在我正在尝试简单的代码

dividends = load 'NYSE_dividends' as (exchange, symbol, date, dividend);
grouping= group dividends by symbol;
avg= foreach grouped generate group, AVG(dividends.dividend);

store avg into 'average_dividend'.

在我的机器上形成一个名为average_dividend的文件夹。

现在根据本书,如果我想在本地模式下运行它,我必须提供以下语法

pig_path/bin/pig -x local average_dividend.pig

但是文件average_dividend.pig在哪里(就像它在哪里形成的那样)?

1 个答案:

答案 0 :(得分:1)

我假设您正在尝试运行examples Programming Pig之一。 首先在解压缩代码的目录中找到average_dividend.pig。 由于您在本地模式工作,因此必须将路径设置为NYSE_dividends, 例如:load '/home/user/programmingpig-master/data/NYSE_dividends', 在您要保存结果的位置设置输出目录(不应该存在),例如: store avg into '/home/user/output'

然后发出:

pig_path/bin/pig -x local -f average_dividend.pig