我想写一个函数,给定一个URL,返回由wget URL
下载的文件的名称。
我不太了解wget
的行为。如果我wget
,python.org
,www.python.org
或http://www.python.org
http://www.python.org/
,则下载的文件名称为index.html
。
但是,如果我www.python.org/about
,则下载的文件名称为about
,而不是index.html
。
答案 0 :(得分:0)
wget
在第一种情况下提取index.html
的原因是因为这是服务器指向的默认“主页”。 python.org
,www.python.org
,http://www.phython.org
和http://www.python.org/
不是文件,因此服务器将wget
指向index.html
。它也会将您的浏览器指向那里,尽管您通常不会看到它。 www.python.org/about
是一个不同的页面,因此下载的文件具有不同的名称是有道理的。
如果您想知道它是如何工作的,我可以推荐man page用于wget吗?如果它是与您有关的下载文件的名称,您可以选择通过-O
选项进行更改。