如何从.tsv文件中加载Pig中的数据?

时间:2017-05-31 14:10:21

标签: hadoop apache-pig

我有一个包含HDFS数据的.TSV文件,我无法将其加载到Pig中。 我正在使用的命令是“

A = load 'file_location' as (name:chararray, age:int, gpa:float);
B = foreach A generate (name, age);
DUMP B;
  

返回错误:无法找到别名A的运算符

2 个答案:

答案 0 :(得分:0)

这样做

A = load' path / of / file'使用PigStorage(' \ t')AS(名称:chararray,年龄:int,gpa:float);

B = foreach A生成名称,年龄;

DUMP B;

ps:我不认为你的命令有任何错误。由于tab(\ t)是pig的默认分隔符。我用你的命令得到了正确的输出。请你把你的终端的日志或截图发给我。

答案 1 :(得分:0)

如果你没有指定分隔符,PIG使用默认的','作为加载文件的分隔符。你的load语句失败。你必须明确指定分隔符'\ t'。

value