我正在阅读Sitemaps.org协议(http://www.sitemaps.org/protocol.html),因此我可以创建自己的协议。但是有一个问题浮出水面:我如何处理子页面,例如http://www.example.com/page/subpage?
我可以将其用作'顶级'<url>
标记,还是在<url>
标记中生成<url>
?或者我为每个顶级页面使用<urlset>
?
有了这个,我可以将一个* .php文件转换为我的robots.txt中的XML文件供Google查找。或者我是否有义务使用* .xml文件?
提前致谢,
答案 0 :(得分:1)
不,不要在url
中嵌套url
。
每个网址都有自己的url
元素。它们是urlset
元素的所有直接子项。
Bots不一定假定(或理解)URL中的“层次结构”(/page/subpage/subsub/…
)。他们用它作为一个独特的字符串;如果您关于汤食谱的页面位于/recipes/soups
或/soups
或/what-i-like
,那么对他们来说无关紧要(当然,还有其他原因/用例为什么分层网址可能会是一个好主意。)
有了这个,我可以将一个* .php文件转换为我的robots.txt中的XML文件供Google查找。或者我是否有义务使用* .xml文件?
如何创建XML文件并不重要,只有它以XML格式传递(例如Content-type application/xml
)。扩展名(.xml
,.php
,...,根本没有)应该无关紧要。
请注意,您还可以使用RSS 2.0, Atom, or even plain text创建站点地图。