我正在尝试使用plotly
建立同类群组保留图。所以我这里是第一个数据集的一个样本(表名:userjoining):
createdAt trails_count userId userName
2018-07-01 00:00:10 0 ***** ******
这表示用户何时加入,createdAt
是他/她创建帐户的日期时间。
这是我的第二个数据集(表名称:storeactivity)的示例:
dateTime userId
2018-07-01 00:00:00 *****
表示用户何时打开应用程序。
我想绘制一个保留图,例如每周和每天,直到月底有多少用户打开该应用程序。这是我要绘制的示例图的链接,但也是每周一次,这里每天都代表一次。 链接:https://d35fo82fjcw0y8.cloudfront.net/2017/10/16092847/Phase-1.png
但是问题是我无法理解如何合并两个表和groupby``userId
,也无法理解它们何时打开应用程序以及它们如何保持保留直到最后从加入之日起一周。
问题是,每天都有人或其他新用户弹出,因此我必须区分他们的每周保留时间与他们的获取日期。那么有任何提示或示例代码,这样我就可以获得类似的东西?
我还想生成一个csv文件,就像有多少用户从获取日期开始每周至少打开一次。