我需要统计熊猫问题的帮助。
所以我有一个如下数据框
user_id user_total_exercises
8 1.0
32794352 5.0
28109145 17.0
26424341 68.0
32769624 85.0
26870381 698.0
其中user_total_exercises
列对应于用户在一年中(即2018年)完成的锻炼总数。
我还拥有同一年所有用户完成的练习的总数,称为year_total_exercises = 874
。
鉴于此数据,我想将其划分为三分位数,以便为三分位数1,三分位数2和三分位数的用户获取user_total_exercises的值。
问题是我并不十分了解统计知识,所以对这个问题的任何帮助将不胜感激。
非常感谢您!
更新:
所以我使用了以下内容:
categories = pd.qcut(df['user_total_exercises'], 3, labels=false)
我得到的结果就是这个:
0
0
1
1
2
2
我不明白这个结果。如果有人可以帮助我,我将非常感激。
非常感谢:)