我有两列。一个user_id,另一个是每个用户的生产价值。 我想知道最活跃用户的前10%的生产百分比。
我尝试过Lead,但是由于我不知道它是如何工作的,所以无法获得正确的结果。
这是我桌子的样品
userid | production
42539973@N00 | 6572
13407304@N05 | 6765
50780708@N02 | 6958
92607898@N00 | 7826
52996072@N04 | 7889
57868312@N00 | 8226
90484572@N00 | 8444
26650236@N07 | 8802
26650236@N08 | 88802
26650236@N09 | 98802
例如10%的用户为1,如果我们根据“生产”值订购他们,则该用户是最后一个用户,而该用户生产了将近10%的总产量,该总产量由10%的总产量计算得出od用户除以所有生产值的总和。
答案 0 :(得分:1)
由于您没有向我们显示预期的输出,因此我刚刚创建了SQL,用于过滤10%的最有生产能力的用户,用他们的生产总和除以所有用户的生产得出的结果。
with cnt as (select round(count(1)*0.1) no_users, sum(production) production_sum from your_table),
users as (select userid, distance production,
sum(production) over (order by production desc rows between unbounded preceding and 0 FOLLOWING) production_10,
row_number() over (order by production desc) rnk,
no_users,
production_sum
from your_table, cnt)
select no_users,
production_10,
production_sum,
round(production_10/production_sum*100,2) prc_production
from users
where no_users=rnk