我有3个表到批量输入,如何在猪中指定参数?
例如,tmp / 001.csv,tmp / 002.csv,tmp / 003.csv,在pig脚本中,如何编写-param和LOAD语句一次输入这些表?
有人给我一个例子
pig -param nums="'001','002','003'" test.pig
在猪脚本中,
LOAD 'tmp/{nums}.csv' AS ...
但看起来猪只能读取001.csv。
答案 0 :(得分:5)
你很可能也需要将/tmp
移到params:
pig -param ins=/tmp/001.csv,/tmp/002.csv,/tmp/003.csv test.pig
LOAD '${ins}' AS ...
显然,如果您要列出许多文件(并且它们都可以匹配简单的glob),那么这可以进一步减少:
pig -param ins=/tmp/*.csv test.pig