如何用猪输入多参数

时间:2012-06-20 08:41:03

标签: hadoop apache-pig

我有3个表到批量输入,如何在猪中指定参数?

例如,tmp / 001.csv,tmp / 002.csv,tmp / 003.csv,在pig脚本中,如何编写-param和LOAD语句一次输入这些表?

有人给我一个例子

pig -param nums="'001','002','003'" test.pig

在猪脚本中,

LOAD 'tmp/{nums}.csv' AS ...

但看起来猪只能读取001.csv。

1 个答案:

答案 0 :(得分:5)

你很可能也需要将/tmp移到params:

pig -param ins=/tmp/001.csv,/tmp/002.csv,/tmp/003.csv test.pig

LOAD '${ins}' AS ...

显然,如果您要列出许多文件(并且它们都可以匹配简单的glob),那么这可以进一步减少:

pig -param ins=/tmp/*.csv test.pig