我正在使用Azure Application Insights跟踪Web应用程序上的用户流(登录,单击按钮X,指向页面Y,单击按钮Z等),但是AII仅保存过去90天的数据。我想将用户流图创建为Sankey Plots。我已经设置了一段时间的连续导出,因此导出的每一天都有很多CSV文件,其中包含事件名称,会话ID,用户ID,时间戳等列。
我已将所有这些CSV合并到一个大型Dataframe中的Azure Databrick中,并记录了所有事件。我认为最好的方法是按会话ID分组,为事件顺序添加索引,然后按该索引分组,以便索引1的组具有所有登录名,索引2的组具有用户登录后所做的一切。从那里我不确定我会做什么,但是现在我仍然坚持创建这些数据框/分组数据框。
任何有关采用其他方法或创建这些分组数据帧的建议将不胜感激。谢谢!