你能用Wget创建干净的URL吗?

时间:2014-05-10 22:39:51

标签: wget gnu

我正在尝试使用干净的网址创建一个WordPress网站的镜像(即http://example.org/foo 而不是 http://example.org/foo.php)。当Wget镜像网站时,它会为所有页面和链接提供“.html”扩展名(即http://example.org/foo.html)。

是否可以为Wget设置选项以创建干净的URL结构,以便与“http:example.org/foo”页面对应的镜像文件为“/foo/index.html”,并指向该页面将是“http:example.org/foo”?如果是这样,怎么样?

1 个答案:

答案 0 :(得分:2)

如果我正确理解您的问题,您就会询问Wget的默认行为。

如果已将--adjust-extension选项传递给本地副本,则Wget只会将扩展名添加到本地副本。引用Wget的手册页:

   --adjust-extension
       If a file of type application/xhtml+xml or text/html is downloaded and the URL does not end with the regexp \.[Hh][Tt][Mm][Ll]?, this option will cause the suffix .html to be appended to the
       local filename.  This is useful, for instance, when you're mirroring a remote site that uses .asp pages, but you want the mirrored pages to be viewable on your stock Apache server.  Another good
       use for this is when you're downloading CGI-generated materials.  A URL like http://example.com/article.cgi?25 will be saved as article.cgi?25.html.

但是,您似乎要求的是,Wget将example.org/foo保存为/foo/index.html实际上是默认选项。如果您正在查看其他输出,则应使用--debug开关发布Wget的完整输出。