用于计算网站总页数的脚本

时间:2016-01-08 17:41:54

标签: json api google-analytics

我正在尝试编写一个脚本,每天检查我们的网站,查看我们拥有的网页总数。如何使用Google Analytics等API执行此操作?使用JSON会很好。所以这就是它的样子,也许有人可以帮忙吗?

    {
 "startDate": "{date.startOfMonth.format()}",
 "endDate": "{date.today}",
 "dimensions": ["query","page"]
}   

1 个答案:

答案 0 :(得分:0)

正如nyuen指出的那样,您无法使用Google Analytics计算网络中的每个网页。 GA只会注册a)拥有GA跟踪代码的页面,以及b)在您选择的时间范围内至少执行过一次跟踪代码。通常是大多数页面,但你无法确定。

您可以执行的操作是发出查询页面路径维度的查询,并且至少有一个指标 - 网页浏览量很明显。这不是因为您实际上需要为您的目的查看网页浏览量,而是因为没有至少一个指标的查询将无效。通过API或query explorer发送查询,然后只计算结果集中的行数。由于页面路径是唯一的,因此结果的数量是在所选时间范围内具有综合浏览量的不同页面的数量,这是GA将获得的结束。

但实际上有一些工具可以用来做你想做的事情,所以你可能想从那些开始 - 例如你可能让你的脚本进行系统调用(假设一个linux系统)到wget --spider选项,它将在给定域上创建文件列表。这不需要跟踪代码(它通过页面源代码中的以下链接来工作)。在Windows上还有像Screaming frog这样的网络蜘蛛软件(在脚本中并没有真正起作用,但我想Windows有一些任务调度工具,允许你在预定义的时间启动程序),这不仅仅是计数但也返回有关您网站健康状况的信息(死链接等)。

或者,由于这似乎是您的服务器,您可能会编写一个遍历文件系统的脚本并列出它遇到的文件列表(如果您的页面是动态生成的,则不会起作用,因为这只会计算物理文件)。

或者您编写一个脚本来解析您的服务器日志并提取对内容文件的调用(仅适用于实际查看过的文件)。

因此,为此目的使用Google Analytics有许多更好的替代方案,您可能需要先查看其中一个。