遍历http遍历目录

时间:2013-03-04 09:08:13

标签: python urllib

假设我有一个URL http://example.com/result,它将打开一个页面,有一些(目录的数量可以是一个,两个,三个......任意数量的目录)目录。我想遍历每个目录并查找new.txt文件,该文件可以是dir或sub目录内的任何文件....

http://example.com/result有以下目录:

security
major
minor
fails
logs
..

我需要在每个目录中找到new.txt并想要阅读内容。 所有目录(security / major / ...等)也可能有子目录。 我需要在目录或子目录中找到new.txt。

1 个答案:

答案 0 :(得分:1)

如果你想使用python,那么你必须使用urllib

检查每个页面的标题。对于目录和文件,将有链接标记。转到该链接标记并检查标题。文件和目录的标头可能不同。

如果其目录然后递归调用相同的函数并检查该目录中的每个文件。