有没有办法筛选目录列表?

时间:2012-03-21 17:05:56

标签: php screen-scraping

我有一个服务器,其中包含“网页”的目录列表。我无法控制服务器或输出。他们只是将文件放在目录中,因为它们打开了目录列表,它会显示在列表中。你可以想象,这是一团糟。

反正我是否可以使用该目录列表并将其放入可用的某种形式?如果重要,他们的服务器就是IIS。

我将在IIS(不同的服务器)上使用PHP。我想我可以使用卷曲,但我不确定,也不知道我会做什么。我希望能够按字母顺序或日期排序。

感谢您的帮助。

编辑:我在这里尝试了答案中的信息:

Can I parse the directory listing of an external webpage?

$contents = file_get_contents("http://www.ibiblio.org/pub/");
preg_match_All("|href=[\"'](.*?)[\"']|", $contents, $hrefs);
var_dump($hrefs);

我被退回了:

 array(2) { [0]=> array(0) { } [1]=> array(0) { } }

该页面只是标准的IIS列表。它有日期,时间,大小,然后是文件的html链接。这是一个标准的href链接。

因此,相关网页中的链接如下所示:

<A HREF="/">[To Parent Directory]</A>

0 个答案:

没有答案