Question

我正在使用BlackFriday.csv数据集。下面是摘录。

    User_ID  Gender  Age    City_Category   Purchase
0   1000001     1     0           1          8370
1   1000001     1     0           1          15200
2   1000001     1     0           1          1422
3   1000001     1     0           1          1057
4   1000003     0     2           1          15227
5   1000004     0     4           2          19215
6   1000004     0     4           2          15854
7   1000004     0     4           2          15686
8   1000005     0     2           1          5254
11  1000005     0     2           1          15665
12  1000006     1     5           1          2079
13  1000006     1     5           1          13055
14  1000006     1     5           1          8851
15  1000007     0     3           2          11788
16  1000008     0     2           0          8584

我想知道如何计算客户属于的概率 City_Category = 2。

Answer 1

您可以使用：

s1=df.drop_duplicates('User_ID').groupby('City_Category')['User_ID'].count()
df2=(s1/(s1.sum())*100).to_frame()

输出df2：

User_ID
City_Category   
0   14.285714
1   57.142857
2   28.571429

查找属于列表的元素的概率

1 个答案: