多列中的多条件和熊猫中的重复值

时间:2019-03-20 17:09:52

标签: python pandas numpy

我需要根据以下内容将new_status列分为“新”或“现有”:

-如果客户订阅在第一个周期内(1个月或1年,取决于plan_interval并以“今天”作为比较)将是“新的”。否则,它不再是新事物(在第一个周期之后),因此它将是“现有的”。

-订阅在trial_end之后开始,但是,trial_end为空,订阅在创建日期之后开始。

注意:该客户可能有多个订阅,最近的订阅将计入整个客户的new_status。

customer|old_status|created  |trial_end|plan_interval|new_status
   x    |active    |2/15/2019|3/15/2019|month        |
   y    |active    |5/19/2018| -       |year         |
   z    |active    |2/5/2018 |3/6/2018 |month        |
   a    |active    |3/1/2017 | -       |month        |
   a    |active    |3/5/2018 | -       |year         |

所需的输出:

customer|old_status|created  |trial_end|plan_interval|new_status
   x    |active    |2/20/2019|3/20/2019|month        |New
   y    |active    |5/19/2018| -       |year         |New
   z    |active    |2/5/2018 |3/6/2018 |month        |Existing
   a    |active    |3/1/2017 | -       |month        |New
   a    |active    |3/5/2018 | -       |year         |New

0 个答案:

没有答案