我是APACHE PIG的初学者,以下是我的轻微混淆
我正在尝试使用本地模式运行pig 猪-x本地。
现在我正在尝试简单的代码
dividends = load 'NYSE_dividends' as (exchange, symbol, date, dividend);
grouping= group dividends by symbol;
avg= foreach grouped generate group, AVG(dividends.dividend);
store avg into 'average_dividend'.
在我的机器上形成一个名为average_dividend的文件夹。
现在根据本书,如果我想在本地模式下运行它,我必须提供以下语法
pig_path/bin/pig -x local average_dividend.pig
但是文件average_dividend.pig在哪里(就像它在哪里形成的那样)?
答案 0 :(得分:1)
我假设您正在尝试运行examples Programming Pig之一。
首先在解压缩代码的目录中找到average_dividend.pig
。
由于您在本地模式工作,因此必须将路径设置为NYSE_dividends
,
例如:load '/home/user/programmingpig-master/data/NYSE_dividends'
,
在您要保存结果的位置设置输出目录(不应该存在),例如:
store avg into '/home/user/output'
。
然后发出:
pig_path/bin/pig -x local -f average_dividend.pig