如何根据熊猫数据框上的条件分配变量值?

时间:2020-04-19 15:52:40

标签: python python-3.x pandas

我有一个看起来像这样的数据框:

    number       type   username  product publishing_dt          genres  count
0        1     access   kerrigan      897    2019-03-05             VXA      0
1        1     access   kerrigan     1459    2008-05-06         VXA,VHS      0
2        1  orderline  45michael    76863    2019-10-04        VXA,B,GT      1
3        1  orderline  45michael    86833    2020-02-04          VS,KJM      1
4        1  orderline  45michael   130365    2020-02-10   VXA,GT,B,JFSS      1
5        1  orderline    alicia7   130365    2020-02-10   VXA,GT,B,JFSS      1
6        1  orderline     angel8    86217    2017-01-06           B,GTE      1
7        1  orderline      john5    86833    2020-02-04          VS,KJM      1
8        1  orderline      john5   130365    2020-02-10   VXA,GT,B,JFSS      1
9        1  orderline   kerrigan    76863    2019-10-04        VXA,B,GT      1
10       1  orderline   kerrigan  1023897    2020-01-07          GT,VHS      1
11       1  orderline     kylemm   537077    2017-05-07          VXA,GT      1
12       1  orderline     uololo   830166    2019-12-05           VXA,B      1
13       3     access     7762hc    84325    2018-04-03  VHS,GT,GTE,VXA      0
14       4     access   adrian12   997165    2016-02-01            B,GT      0
15       4     access   kerrigan     5467    2020-01-24         VXA,VHS      0
16       4     access      yvera    76863    2019-10-04        VXA,GT,B      0
17       5     access   kerrigan   130365    2020-02-10   VXA,GT,B,JFSS      0
18       6     access   kerrigan     2345    2020-02-01         VXA,VHS      0
19       7     access   kerrigan    78921    2019-11-03          GTE,BS      0
20       7     access   kerrigan    86833    2020-02-04          VS,KJM      0
21       8     access   kerrigan      645    2020-02-10         VXA,VHS      0
22      10     access  45michael    63767    2020-01-01        GT,B,VHS      0

类型表示用户对产品的访问类型(如果是购买(“ 订单行”)),或者如果是访问(“ 访问权限”),则 product 是相关产品的唯一标识符,即 number 是用户访问产品的次数(如果类型==访问权限,则是 ),而 count 表示用户购买产品的次数。

我想将 count 值更改为从0到1 ,其中0表示未购买和未购买,1表示已购买,并且介于比例与访问次数相对应,因此20或更多次为0.9,10次为0.5,依此类推。

关于如何执行此操作的任何想法?

预期输出:

    number       type   username  product publishing_dt          genres  count
0        4     access   kerrigan      897    2019-03-05             VXA    0.2
1       10     access   kerrigan     1459    2008-05-06         VXA,VHS    0.5
2        1  orderline  45michael    76863    2019-10-04        VXA,B,GT    1.0
3        1  orderline  45michael    86833    2020-02-04          VS,KJM    1.0
4       15     access  45michael   130365    2020-02-10   VXA,GT,B,JFSS    0.8

0 个答案:

没有答案