计算R给定数据变量的流失率

时间:2016-08-30 20:03:51

标签: r churn

我试图计算使用R的留学生人数。我使用的两个变量是' registration_date' (mm / dd / yr)和' date_of_last_login' (MM / DD /年)。如果学生在前30天内登录,则被视为保留。

ID                    1 ,      2,        3,         4,          5
registration_date    2/1/15, 2/1/15,  3/15/15,   2/10/15,    4/15/15
date_of_last_login   2/3/15, 3/15/15, 4/30/15,   4/25/15,    5/16/15

我想这个想法是创建一个新变量:'留住学生'但我不确定如何在R中设置公式。

1 个答案:

答案 0 :(得分:0)

假设你的意思是今天之前的30天:

last_login <- c("2/3/15","3/15/15","4/30/15")
login <- as.Date(last_login, format = '%m/%d/%y')

retained_students <- (Sys.Date()-login < 30)
retained_students

retain_students是每个登录名为TRUE或FALSE的向量