在我的hadoop环境中,输出目录是动态创建的。因此,我想动态地读取输出目录,如果存在路径或文件,请执行此操作,否则执行此操作。那么有没有办法检查"路径或文件存在"在猪脚本。??
答案 0 :(得分:2)
在Pig中,您可以运行shell命令来测试路径是否存在,如果是,则返回该路径,否则返回一些始终可用的其他空数据路径。然后依靠Pig的参数替换。
例如:
%declare emptyPath '/user/me/emptyData.csv'
%declare requestedPath '/user/me/realData.csv'
%declare actualPath `sh -c "hdfs dfs -test -e '$requestedPath '; if [ \\$? -eq 0 ]; then echo '$requestedPath '; else echo '$emptyPath '; fi"`
a = load '$actualPath' using PigStorage(',') as (line:chararray);

答案 1 :(得分:0)