获取字符串部分后面的整数?

时间:2012-08-07 22:17:36

标签: php

我有一堆字符串,可能有也可能没有类似于以下内容的子字符串:

<a class="tag" href="http://www.yahoo.com/5"> blah blah ...</a>

我试图在链接的末尾检索'5'(不一定是一位数字,它可能很大)。但是,这个字符串会有所不同。链接之前和之后的文本将始终不同。唯一相同的是<a class="tag" href="http://www.yahoo.com/和结束</a>

4 个答案:

答案 0 :(得分:1)

尝试parse_url()。从那里应该很容易。

答案 1 :(得分:1)

您可以使用preg_match_all<a class="tag" href="http:\/\/(.*)\/(\d+)">正则表达式来执行此操作。

答案 2 :(得分:0)

我会选择“basename”:

// prints passwd
print basename("/etc/passwd")

要获得您可以使用的链接:

$xml  = simplexml_load_string( '<a class="tag" href="http://www.yahoo.com/5"> blah blah ...</a>' );
$attr = $xml->attributes();
print $attr['href'];

最后:如果你不知道字符串的整个结构,请使用:

$dom = new DOMDocument;
$dom->loadHTML( '<a class="tag" href="http://www.yahoo.com/5"> blah blah ...</a>asasasa<a class="tag" href="http://www.yahoo.com/6"> blah blah ...</a>' );
$nodes = $dom->getElementsByTagName('a');
foreach ($nodes as $node) {
    print $node->getAttribute('href');
    print basename( $node->getAttribute('href') );
}

因为这也会修复无效的HTML代码。

答案 3 :(得分:0)

由于你只需要检索5,所以很简单:

$r = pret_match_all('~\/(\d+)"~', $subject, $matches);

然后是第一个匹配组。

如果您需要更多信息,例如链接文字,我建议您使用HTML Parser:

require('Net/URL2.php');

$doc = new DOMDocument();
$doc->loadHTML('<a class="tag" href="http://www.yahoo.com/5"> blah blah ...</a>');
foreach ($doc->getElementsByTagName('a') as $link)
{
    $url = new Net_URL2($link->getAttribute('href'));
    if ($url->getHost() === 'www.yahoo.com') {
        $path = $url->getPath();
        printf("%s (from %s)\n", basename($path), $url);
    }
}

示例输出:

5 (from http://www.yahoo.com/5)