我正在尝试使用干净的网址创建一个WordPress网站的镜像(即http://example.org/foo 而不是 http://example.org/foo.php)。当Wget镜像网站时,它会为所有页面和链接提供“.html”扩展名(即http://example.org/foo.html)。
是否可以为Wget设置选项以创建干净的URL结构,以便与“http:example.org/foo”页面对应的镜像文件为“/foo/index.html”,并指向该页面将是“http:example.org/foo”?如果是这样,怎么样?
答案 0 :(得分:2)
如果我正确理解您的问题,您就会询问Wget的默认行为。
如果已将--adjust-extension
选项传递给本地副本,则Wget只会将扩展名添加到本地副本。引用Wget的手册页:
--adjust-extension
If a file of type application/xhtml+xml or text/html is downloaded and the URL does not end with the regexp \.[Hh][Tt][Mm][Ll]?, this option will cause the suffix .html to be appended to the
local filename. This is useful, for instance, when you're mirroring a remote site that uses .asp pages, but you want the mirrored pages to be viewable on your stock Apache server. Another good
use for this is when you're downloading CGI-generated materials. A URL like http://example.com/article.cgi?25 will be saved as article.cgi?25.html.
但是,您似乎要求的是,Wget将example.org/foo
保存为/foo/index.html
实际上是默认选项。如果您正在查看其他输出,则应使用--debug
开关发布Wget的完整输出。