如何获取网页的站点地图?

时间:2015-10-31 21:24:23

标签: web sitemap

我正在尝试分析一些页面并获取所有必要的信息,我需要知道他们的网络结构(网站地图 - 网页地图,类似于此Czech pagesHarvard pages

是否有一些在线服务计划,我向其提供了网址,然后显示了网站地图(我知道可以有链接到其他页面,但如果该服务可以选择只搜索某个级别,那就太棒了)

1 个答案:

答案 0 :(得分:0)

站点地图通常存在于位于网站根目录的文件中,并命名为sitemap.xml。

  

例如:http://www.abcdef.com/sitemap.xml

否则,如果它不存在,您可以尝试查看名为robots.txt文件的文件(仍在网站的根目录)

  

可以像robots.txt中那样定义:
  网站地图:http://www.abcdef.com/sitemap.xml