我们正在关闭The Conversations Network(包括IT Conversations播客)。计划是在Internet Archive呈现我们网站的静态HTML版本,以便永久托管。
从当前从PHP动态生成的大约5,000个动态页面生成静态HTML的最简单方法是什么?
我知道我们可以调整代码来缓存PHP输出,将其写入文件,然后遍历站点地图以生成每个页面。但我想知道是否有任何我们应该考虑的选择。用于执行此操作并按原样刮取HTML的任何工具? (Acrobat Pro以外的其他东西?)
不幸的是,我们也有相当多的Ajax调用,这将使这更加困难。我想我们必须首先取消它们的Ajax。
答案 0 :(得分:5)
这可能不是你想要的;但是HTTrack会浏览您的网站以获取链接并保存其HTML版本。此镜像将包含链接的所有静态内容,例如images,css和javascript。
我能想到的唯一问题是你的AJAX脚本是否正在从服务器中提取重要数据,但HTTrack可能有这样的设置。
答案 1 :(得分:2)
有一个很棒的软件称为“Teleport Pro”(不幸的是付费软件),它可以创建一个可浏览/重复的网站副本。一旦上传到服务器,它应该与原始站点完全相同。
当您从动态网页创建静态html时,请记住这些事项;
但是“Teleport pro”是一个真正可靠的程序,它已存在很长一段时间了。我过去曾经使用它,可能会再次使用它。
另一种方法可能是创建缓存的php模块“php-apc”。在这种情况下,您需要在创建完整缓存之前爬网整个站点。我不太熟悉它,但安装很容易,你可以看看生成的文件是否有用。