搜索文件&在网站上的Dirs

时间:2009-02-06 13:55:32

标签: python

即时编码,可编码搜索Dirs和文件的工具。

已经这样做了该工具搜索目录,但需要帮助才能搜索网站上的文件。

知道如何在python中使用它吗?

4 个答案:

答案 0 :(得分:1)

此工具是否扫描您自己网站的目录(工具正在运行)或外部网站?

答案 1 :(得分:1)

如果您有权浏览网站上的目录并且不存在默认页面,则只能执行此操作。

答案 2 :(得分:1)

您无法在网站上获取目录列表。

迂腐地说,HTTP没有目录的概念。

实际上,WebDAV提供了一个目录列表动词,因此如果启用了WebDAV,您可以使用它。

否则,您可以做的最接近的事情类似于递归wget所做的:获取页面,解析HTML,查找超链接(xpath中的a/@href),过滤掉下面未指向URL的超链接当前页面,递归到剩余的网址。

您可以根据用例进行进一步过滤,例如删除网址的查询部分(第一个?之后的任何内容)。

当服务器启用了目录列表功能时,这会为您提供可用的功能。如果网站没有目录列表但是以合理的方式组织,这也为您提供了一些可用的东西。

答案 3 :(得分:0)

如果您在自己的网站上获取信息以便在自己的网络应用程序中进行演示,则应使用os.walk。

有关详细信息,请参阅http://www.python.org/doc/2.5.2/lib/os-file-dir.html