在网站上找到#pages

时间:2014-03-18 19:42:04

标签: google-analytics web-scraping

我收集了几个域的复杂性数据 - 由访问和未访问的总页数表示。

我最初通过向下钻取到Behavior -> Site Content -> Landing Pages来查找我想要的Google Analytics,但不确定是否返回了未访问过的网站。然后我尝试了每个域All Pages,但是对于"页面"返回了1,800个结果,在某些情况下使用params /Pages/Results.aspx?k=update

话虽如此,我认为我不能依靠GA来获取每个网站的总页数。

然后我考虑使用网络刮刀,即web2disk或httrack.com,来搜索每个域的#pages。那是一条很好的路吗?是否有必要获取此信息?

由于

1 个答案:

答案 0 :(得分:1)

如果您想知道您网站上有多少个网页,则需要抓取您的网站以查找所有网页。由于它的工作方式,Google Analytics(分析)将100%仅显示已在浏览器中加载(激发分析代码)的页面上的数据。

http://www.screamingfrog.co.uk/seo-spider/是一个付费的抓取工具,您可以用来查找所有网页(99英镑),或者您可能会尝试使用像http://import.io这样的免费抓取工具来破解某些内容(免责声明:我工作在import.io)获取所有URls。

通过GA查找所有访问过的页面: 行为 - >网站内容 - >登陆页面不会为您提供任何“登陆”页面。

  

然后我尝试了每个域的所有页面,但是对于“页面”返回了1,800个结果,在某些情况下使用params /Pages/Results.aspx?k=update。

要从页面URls中删除参数,您可以使用表格右上角的报告过滤器。单击“高级”,然后使用那里的工具从URls中排除params。

如果您为每个页面设置了唯一页面标题(对于带有参数的页面具有相同的页面标题),您也可以将主要维度切换为“页面标题”。