将数据分为大熊猫

时间:2019-05-04 09:52:25

标签: python pandas percentile

我需要统计熊猫问题的帮助。

所以我有一个如下数据框

   user_id          user_total_exercises
   8                    1.0
   32794352             5.0
   28109145             17.0
   26424341             68.0
   32769624             85.0
   26870381             698.0

其中user_total_exercises列对应于用户在一年中(即2018年)完成的锻炼总数。

我还拥有同一年所有用户完成的练习的总数,称为year_total_exercises = 874

鉴于此数据,我想将其划分为三分位数,以便为三分位数1,三分位数2和三分位数的用户获取user_total_exercises的值。

问题是我并不十分了解统计知识,所以对这个问题的任何帮助将不胜感激。

非常感谢您!

更新:

所以我使用了以下内容:

categories = pd.qcut(df['user_total_exercises'], 3, labels=false)

我得到的结果就是这个:

0
0
1
1
2
2

我不明白这个结果。如果有人可以帮助我,我将非常感激。

非常感谢:)

0 个答案:

没有答案