当我在“细胞值”中使用class ScalaJob(@transient sc: SparkContext ) extends Serializable { }
时总计不是总结而是显示FIRST(CG1)
的结果中的一个值。
请告知我们是否必须始终使用FIRST(CG1)
来获得总计。
答案 0 :(得分:2)
简短回答,是的,如果您希望Grand Total
是数据的总和。将总计应用于不同的聚合将产生不同的结果。
AVG
将平均Category Axis
MAX
将针对每个类别MAX
{/ 1}} Max
会在Cumulative Sum
中显示“最后”值,因为它没有Category
的任何其他值。SUM
将采用Product
Product of Products
和First
。答案 1 :(得分:0)
长答案:
实际上,您可以对列分组中列的第一个值求和。
例如,请考虑以下数据集。
[分组] [食物] [颜色] [重量]
水果苹果黄4
水果苹果绿2
水果苹果红4
水果香蕉黄5
Fruit Banana Brown 2
水果橘子橙3
蔬菜胡萝卜橙4
如果在自定义表达式中添加了
Sum(if(RankReal([Grouping], "ties.method=first", [Food]) = 1, [Weight], 0))
它会在您的数据集中找到每种食物的第一个实例,因此无论您如何对左侧进行分组,您的结果,小计和总计将仅将每种食物的第一个实例相加。
所以你将能够看到以下内容:
Fruit Apple 4
香蕉5
橙色3
小计:12
蔬菜胡萝卜4
小计:4
总计:16