站点地图协议子页面

时间:2013-01-31 08:32:03

标签: xml sitemap robots.txt

我正在阅读Sitemaps.org协议(http://www.sitemaps.org/protocol.html),因此我可以创建自己的协议。但是有一个问题浮出水面:我如何处理子页面,例如http://www.example.com/page/subpage

我可以将其用作'顶级'<url>标记,还是在<url>标记中生成<url>?或者我为每个顶级页面使用<urlset>

有了这个,我可以将一个* .php文件转换为我的robots.txt中的XML文件供Google查找。或者我是否有义务使用* .xml文件?

提前致谢,

1 个答案:

答案 0 :(得分:1)

不,不要在url中嵌套url

每个网址都有自己的url元素。它们是urlset元素的所有直接子项。

Bots不一定假定(或理解)URL中的“层次结构”(/page/subpage/subsub/…)。他们用它作为一个独特的字符串;如果您关于汤食谱的页面位于/recipes/soups/soups/what-i-like,那么对他们来说无关紧要(当然,还有其他原因/用例为什么分层网址可能会是一个好主意。)

  

有了这个,我可以将一个* .php文件转换为我的robots.txt中的XML文件供Google查找。或者我是否有义务使用* .xml文件?

如何创建XML文件并不重要,只有它以XML格式传递(例如Content-type application/xml)。扩展名(.xml.php,...,根本没有)应该无关紧要。

请注意,您还可以使用RSS 2.0, Atom, or even plain text创建站点地图。