我有一点情况出现了。由于完整的网站结构重新设计基本上无法实现,我希望我们的网站地图大约有12,000个网址,其中约90-95%的网站地图会发生变化。在这12,000个中,我预计大约5000-6000个内部链接将在此过程中死亡。此网站尚无外部链接,因为它仍在开发中。
有没有一个工具我可以在重组后提供sitemap.xml并解析每个页面是否有404错误,只报告页面/错误?
我找到了一些工具,但所有工具似乎都限制在100页。
任何建议中级网站管理员帮助解决这种情况?在这种情况下,301重定向是不可行的。
答案 0 :(得分:1)
根据您对编程的经验,执行此操作应该不难(解析sitemap.xml,查找所有链接,向每个链接发出http请求,保存状态代码)。
如果您正在寻找专门的工具,我会说您可以尝试wget(将其提供给站点地图网址,详情请见此处:http://www.wezm.net/technical/2009/05/spider-a-site-with-wget-using-sitemap-xml/)或HTTrack