如何在猪脚本中单行累计字段?

时间:2017-08-10 12:01:33

标签: apache-pig

我有一个包含学生姓名和各种主题标记逗号分隔的数据集,如何总结每个学生的分数 示例数据集记录

Student1 Marks1 Marks2 Marks3 Marks4
(Steve, 78, 23, 45, 34)
(Jobs, 23, 45, 12, 67)

脚本

Student_New = FOREACH Student_File generate Student_Name, (int)TotalMarks:SUM($1,$2,$3,$4,$5); 
Dump Student_New;

我想将输出显示为(总结所有主题标记)

(Steve, 180)
(Jobs, 147)

1 个答案:

答案 0 :(得分:0)

SUM适用于列数据。使用' +'添加这些列。请注意,如果已将Marks1加载到Marks4到int字段,这将起作用。

Student_New = FOREACH Student_File generate Student_Name, ($1+$2+$3+$4) as Total_Marks; 
Dump Student_New;