我有一个包含变量product_id,date,country_id,cumulative_sales
的数据集我需要一个为每个product_id返回的计算字段,即product_id出售的每个国家/地区的最大cumulative_sales的总和。
在伪代码/ python中
for prod_id in df.product_id.unique():
list.append(
(prod_id,
sum[
max(df[product_id==prod_id and country_id==country].cumulative_sales)
for country in df[product_id==prod_id].country_id.unique()
]
))
答案 0 :(得分:0)
创建一个计算字段:
{ FIXED [Product ID], [Country ID] : MAX([Cumulative Sales]) }
然后只计算SUM
该字段。例如,将[Product ID]
拖到行中,然后将计算字段拖到文本中。将聚合设置为SUM
,你应该好好去。