熊猫邻接矩阵分析

时间:2020-06-04 03:49:42

标签: python pandas data-analysis adjacency-matrix

说,我正在研究用户每天(或每周)如何利用页面上可用的5个标签中的特定页面(我们将其仅命名为Tab 1, Tab 2, Tab 3, Tab 4, Tab 5)。 Tab 1是主要的入口点,用户可以从Tab 1转到其他4个选项卡中的任何一个,并做他们需要做的一切,然后继续选择其他选项卡(即{{1} }或Tab 1 -> Tab 2 -> Tab 5,顺序无关紧要)。我想获得经过不同Tab选项路径的用户数量(类似于渠道分析,但在这种情况下,进度和最终目标是什么都没有关系)。我当时想创建一个具有权重的邻接矩阵,可以提供有关用户使用情况的一些见解,了解他们如何在网页中逐步形成某种网络图?目前,我的数据框如下所示(粗略估算):

Tab 1 -> Tab 3 -> Tab 2 -> Tab 5 -> Tab 4

,并且此后持续数月的数据。邻接矩阵是正确的方法吗?还是会有其他更好的选择?并且如果更好,用会话号对时间戳进行分类以过滤掉用户访问选项卡但之后又不访问任何其他选项卡的情况是否有益?还是仅遵循标准的渠道方法,在该方法中,我希望用户希望通过指定的选项卡路径来计算访问量。

另外,如果可以通过邻接矩阵来实现,那么我想在所有用户上进行,然后在用户聚合级别上将其分开。

0 个答案:

没有答案