Question

我有一个Pig UDF，可以在我的管道分离数据文件中将Ebcidic字符转换为ASCII。我有数百列，我希望我的UDF应用于第70列。如何在该特定列上应用UDF并将数据列替换为数据集中的ASCII。

REGISTER pigudf-0.0.1.jar;
DEFINE Ebc2Asc com.z.pig.udf.Ebc2Asc;

A = LOAD '/user/T4/cobDump.txt' USING PigStorage('|');
B = FOREACH A GENERATE Ebc2Asc($71) as txt:chararray;
DUMP B;

如果我们像上面那样调用脚本，那么我只将转换后的列作为结果的一部分。如何获取所有列以及应用的udf列。

任何帮助表示赞赏。

Answer 1

已经有一段时间了，但听起来您想使用range projection自动生成其他列。它应该看起来像：

B = FOREACH A GENERATE $0 .. $70, Ebc2Asc($71) as txt:chararray, $72 .. ;

在单列上应用Pig UDF并自动生成所有其他列

1 个答案: