我有一个包含学生姓名和各种主题标记逗号分隔的数据集,如何总结每个学生的分数 示例数据集记录
Student1 Marks1 Marks2 Marks3 Marks4
(Steve, 78, 23, 45, 34)
(Jobs, 23, 45, 12, 67)
脚本
Student_New = FOREACH Student_File generate Student_Name, (int)TotalMarks:SUM($1,$2,$3,$4,$5);
Dump Student_New;
我想将输出显示为(总结所有主题标记)
(Steve, 180)
(Jobs, 147)
答案 0 :(得分:0)
SUM适用于列数据。使用' +'添加这些列。请注意,如果已将Marks1加载到Marks4到int字段,这将起作用。
Student_New = FOREACH Student_File generate Student_Name, ($1+$2+$3+$4) as Total_Marks;
Dump Student_New;