Preg_match:从一个表达式中的url获取最后两个域段

时间:2012-06-15 07:04:44

标签: php regex url dns preg-match

php.net上有一个例子,说明如何分两步获取最后两个域名:

    <?php 
 //get host name from URL
preg_match("/^(http:\/\/)?([^\/]+)/i",
    "http://www.php.net/index.html", $matches);
$host = $matches[2];

// get last two segments of host name
preg_match("/[^\.\/]+\.[^\.\/]+$/", $host, $matches);
echo "domain name is: {$matches[0]}\n";

/* Output is php.net */

?>

但是如何只使用一个preg_match表达式一步完成?

1 个答案:

答案 0 :(得分:4)

这段代码:

$domain = 'http://www.php.net/index.html';
$url    = parse_url($domain);
$tokens = explode('.', $url['host']);

print_r($tokens);

会给你这个数据:

Array
(
    [0] => www
    [1] => php
    [2] => net
)

我认为没有必要使用正则表达式,因为用它们正确解析URL非常困难。从生成的$ tokens数组中,您可以轻松地提取主机名的任何部分。

更新

print_r($url);

$ url数组包含所有必要的详细信息:

Array
(
    [scheme] => http
    [host] => www.php.net
    [path] => /index.html
)