我有一个带有3列的pandas数据框-pageurl,源和目标,其中pageurl作为索引。源和目标是来自每个页面URL的请求。我已经将源和目标中的请求转换为数字数据。
我想知道是否有一种方法可以找到对应于索引的每个节点的深度。
数据框的示例。
source target
pageurl
www.google.com 1 0
www.google.com 1 2
www.google.com 2 3
www.google.com 0 4
www.facebook.com 5 6
www.facebook.com 5 7
www.facebook.com 5 8
www.facebook.com 5 9
www.facebook.com 10 5
预期结果
想获得每个节点相对于pageurl的深度。关于pageurl,因为相同的请求也会出现在另一个域中。
pageurl node depth
www.google.com 0 1
www.google.com 1 0
www.google.com 2 1
www.google.com 3 2
www.google.com 4 2
www.facebook.com 5 0
目标: 最后,我试图找到不同域的请求如何具有不同的深度。
注意: 上面的数据框只是一小部分。我对100万个Alexa网站进行了全面检查。