可以滥用sitemap.xml来复制整个网站吗?

时间:2012-12-21 11:21:06

标签: web copy sitemap

我打算在我的网站上上传生成内容页面的sitemap.xml。截至目前,如果我尝试使用HTTrack等工具复制整个网站,则无法复制。

现在,如果我想让搜索机器人在本网站上查找和索引内容页面,我将不得不在sitemap.xml文件中包含所有网址。

所以问题是 - 这样的sitemap.xml是否会公开所有网址,从而“促进”网站的完整副本?

对此的输入将受到高度赞赏。

1 个答案:

答案 0 :(得分:1)

技术上,是的。

但我想你真正需要问的问题是“我在乎” 如果答案是肯定的,那么您应该首先考虑是否应该首先将其发布到网上?

构造良好的IA无论如何都会包含每个页面之间的链接(出于导航和搜索引擎优化的原因),因此像HTTrack这样的工具无论如何都可以复制该网站。

您不希望被HTTrack看到的任何内容也需要对普通网络用户不可见 - 即密码保护或不存在。