需要特定的正则表达式才能从此特定链接结构中获取数据

时间:2013-09-26 17:05:19

标签: php regex

我需要使用正则表达式获取网址或号码(此号码仅作为示例,但所有号码都有7位数字)?强制要求不要匹配HTML文件中的所有<a>,而是使用这种确切的结构。

<a href="./view/3049532/">

1 个答案:

答案 0 :(得分:0)

即使是一点也不难。

/<a\s+href="\.\/view\/(\d{7})\/">/

See demo

<?php
$page_content = <<<THIS
<a href="./view/3049532/">
<a href="./view/398562/">
<a href="./view/3652872/">
<a href="./view/3785471/">
THIS;
    preg_match_all('/<a\s+href="\.\/view\/(\d{7})\/">/', $page_content, $matches);
    print_r($matches[1]);

输出:

Array
(
    [0] => 3049532
    [1] => 3652872
    [2] => 3785471
)

并且根据其他人的说法,只要使用正则表达式,如果这是你的最后选择!