如何过滤此网址?

时间:2010-07-07 14:38:23

标签: php

我无法在PHP中找到过滤此代码的代码。

我有多个网址,例如:

www.google.com
www.twiter.com
www.facebook.com
www.youtube.com
www.techcrunch.com/webroot-brightcloud/
www.mashable.com/hello-how-are-you/
www.yahoo.com
www.msn.com

我想要的是我需要使用子目录或页面过滤域。这里的示例techcrunch.com和mashable.com需要从最终列表中删除,因为它们有子页面。

以上是一个示例,因此需要从列表中删除任何具有子页面或子目录的域。

我们如何在PHP中完成

2 个答案:

答案 0 :(得分:1)

array_filter($arr, function ($el) { return strpos($el, "/") === false; });

或版本< PHP 5.3:

function sel($el) {
    return strpos($el, "/") === false;
}
$res = array_filter($arr, 'sel');

答案 1 :(得分:1)

如果只需要过滤正斜杠,那么请使用Artefacto的答案。如果您需要能够处理不太可预测的格式,可以使用parse_url

$url = 'www.techcrunch.com/?a=asd/zxc';
$urlInfo = parse_url("http://$url");
if (strlen(trim($urlInfo['path'], '/'))) {
    // remove from list
}