我打算在我的网站上上传生成内容页面的sitemap.xml。截至目前,如果我尝试使用HTTrack等工具复制整个网站,则无法复制。
现在,如果我想让搜索机器人在本网站上查找和索引内容页面,我将不得不在sitemap.xml文件中包含所有网址。
所以问题是 - 这样的sitemap.xml是否会公开所有网址,从而“促进”网站的完整副本?
对此的输入将受到高度赞赏。
答案 0 :(得分:1)
技术上,是的。
但我想你真正需要问的问题是“我在乎” 如果答案是肯定的,那么您应该首先考虑是否应该首先将其发布到网上?
构造良好的IA无论如何都会包含每个页面之间的链接(出于导航和搜索引擎优化的原因),因此像HTTrack这样的工具无论如何都可以复制该网站。
您不希望被HTTrack看到的任何内容也需要对普通网络用户不可见 - 即密码保护或不存在。