当我使用wget时,我使用JS重定向来到页面巫婆。像这样:
<script language="JavaScript1.2">
var s = "i_08/0101/index.php3";
location.href=""+s;
</script>
wget可以跟随此重定向,还是有任何其他方法可以解决此问题。
答案 0 :(得分:4)
您可以查看为DHTMLGET构建的FAE工具。该项目的目标是在修改后的wget上提供基本的内联js和onload事件:
dhtmlget实用程序用于创建类似于unix中的WGET实用程序的网站的本地副本。它支持http,https协议,以及通过http代理检索.DHTMLGET和WGET的主要区别在于dhtmlget ExecuteS onload和内联javascript。它是为在Illinois功能可访问性评估程序中使用而开发的,用于分析使用javascrpt生成可访问性功能内容的网站。
简单的Google搜索可以引导您访问有关wget js feature request的有趣页面。
答案 1 :(得分:1)
否。
wget
用于按原样下载远程位置,不用作解析包含的JavaScript的Web浏览器。
请注意,wget
遵循标题重定向(例如301)。
我尝试使用lynx -source
但遗憾的是,这也会导致非解析的网页。这个问题的一个替代解决方案就是编写一个脚本来下载页面,然后解析它并自动下载可能的引用,但我会把它留给你。