随机跳转'做什么?在Google的pageRank中真的是什么意思?

时间:2018-06-18 21:33:49

标签: search-engine markov-chains pagerank

我在某处读到,添加了1 / n元素的S矩阵和谷歌使用的软糖因子0.15只是不准确,只是为了解决另一个问题。

另一方面,我在其他地方读到它确实有意义。它用于随机跳转。我们首先询问冲浪者是否想继续点击。所以根据我读到的意思是-85%继续点击-15%不要。

我的问题是......这对第一次点击可能有用。但是这在其他迭代中如何工作?怎么有人可以随意登陆?页面排名的整个假设是不是每个都与另一个相关联?

如果我只是登陆页面而没有来自其他地方,那么排名根本就不准确。

但最重要的是,我不明白添加的1 / n矩阵是什么意思?如果我在一个页面,我只能点击我看到的点击。说我可以去其他地方是什么意思?

如果他们意味着我只是谷歌再次搜索那么为什么不把它称为第二链?为什么要把它包含在第一个?

另外,我停止冲浪是15%,还是15%? (或者他们是一样的吗?)

对于我的第一个问题 - 它是否是一个用于解决其他问题的软糖不准确的因素,或者它确实意味着如上所述的东西,它是一个正确的衡量标准,甚至包括它自己的优点?

1 个答案:

答案 0 :(得分:1)

"随机跳跃"可以对应很多东西:

  • 在网址栏中输入地址
  • 访问"收藏"链路
  • 访问主页(或其中的任何一个链接!)
  • 访问内容聚合器/社交媒体的链接

人们在网上浏览时实际做这些事情;转到索引中的随机页面是一种非常粗略的近似行为。

如果您是谷歌或其他拥有大量冲浪/跟踪数据的实体,您实际上可以衡量人们进入的概率"特别网站,以获得更好的模型!随机跳跃概率不需要完全一致;他们只需要为每个网站都不为零。

随机跳转是确保矩阵/对应链为Ergodic的最简单方法,可以更容易地进行分析并保证收敛。