我有一个概念性的问题。
我想知道像Alexa Internet这样的公司如何确定每个独特页面的给定网站(而不是我自己的)整体流量和流量。我很感激技术上的回应 - 如果你要设计这个功能(我相信它很复杂但是假设......)你会怎么做呢?
提前致谢。
答案 0 :(得分:2)
一种方法是连接到一个或多个核心路由器。从那里,您可以执行深度数据包检查,以查看流量的来源,访问的页面等等。
另一种方法是让人们安装一个浏览器工具栏,记录他们去哪里并将这些信息提交给您。我认为这就是Alexa的工作原理。
第三种方法是让网站所有者安装一些javascript,执行分析并将数据提交给您。谷歌就是这样做的。
第四种方法是从执行上述任何一项的公司购买数据。
答案 1 :(得分:1)
Alexa通过推断使用Alexa工具栏或浏览器扩展的互联网用户子集的浏览会话中的数据来估算网站流量。这不是一个真正随机的样本,因此对这些数据的准确性提出了质疑: http://en.wikipedia.org/wiki/Alexa_Internet#Accuracy_of_ranking_by_the_Alexa_Toolbar
安装Alexa工具栏会修改浏览器用户代理,因此您可以通过使用适当的用户代理字符串扫描服务器日志以获取请求来估算您的站点向Alexa提供数据的访问者百分比。