我有一个看起来像这样的数据框:
number type username product publishing_dt genres count
0 1 access kerrigan 897 2019-03-05 VXA 0
1 1 access kerrigan 1459 2008-05-06 VXA,VHS 0
2 1 orderline 45michael 76863 2019-10-04 VXA,B,GT 1
3 1 orderline 45michael 86833 2020-02-04 VS,KJM 1
4 1 orderline 45michael 130365 2020-02-10 VXA,GT,B,JFSS 1
5 1 orderline alicia7 130365 2020-02-10 VXA,GT,B,JFSS 1
6 1 orderline angel8 86217 2017-01-06 B,GTE 1
7 1 orderline john5 86833 2020-02-04 VS,KJM 1
8 1 orderline john5 130365 2020-02-10 VXA,GT,B,JFSS 1
9 1 orderline kerrigan 76863 2019-10-04 VXA,B,GT 1
10 1 orderline kerrigan 1023897 2020-01-07 GT,VHS 1
11 1 orderline kylemm 537077 2017-05-07 VXA,GT 1
12 1 orderline uololo 830166 2019-12-05 VXA,B 1
13 3 access 7762hc 84325 2018-04-03 VHS,GT,GTE,VXA 0
14 4 access adrian12 997165 2016-02-01 B,GT 0
15 4 access kerrigan 5467 2020-01-24 VXA,VHS 0
16 4 access yvera 76863 2019-10-04 VXA,GT,B 0
17 5 access kerrigan 130365 2020-02-10 VXA,GT,B,JFSS 0
18 6 access kerrigan 2345 2020-02-01 VXA,VHS 0
19 7 access kerrigan 78921 2019-11-03 GTE,BS 0
20 7 access kerrigan 86833 2020-02-04 VS,KJM 0
21 8 access kerrigan 645 2020-02-10 VXA,VHS 0
22 10 access 45michael 63767 2020-01-01 GT,B,VHS 0
类型表示用户对产品的访问类型(如果是购买(“ 订单行”)),或者如果是访问(“ 访问权限”),则 product 是相关产品的唯一标识符,即 number 是用户访问产品的次数(如果类型==访问权限,则是 ),而 count 表示用户购买产品的次数。
我想将 count 值更改为从0到1 ,其中0表示未购买和未购买,1表示已购买,并且介于比例与访问次数相对应,因此20或更多次为0.9,10次为0.5,依此类推。
关于如何执行此操作的任何想法?
预期输出:
number type username product publishing_dt genres count
0 4 access kerrigan 897 2019-03-05 VXA 0.2
1 10 access kerrigan 1459 2008-05-06 VXA,VHS 0.5
2 1 orderline 45michael 76863 2019-10-04 VXA,B,GT 1.0
3 1 orderline 45michael 86833 2020-02-04 VS,KJM 1.0
4 15 access 45michael 130365 2020-02-10 VXA,GT,B,JFSS 0.8