使用正则表达式在HTML标记之间提取数据

时间:2012-08-03 13:54:41

标签: php html regex

使用正则表达式

在HTML标记之间提取数据

我有这个成功的例子,从名称中获取值并放入三个不同的数组

$str = '<ul>
<li><a name="valuehere1" title="titlehere" href="/channel/london/">Link1</a></li>
<li><a name="valuehere2" title="titlehere" href="/channel/games/">Link1</a></li>
<li><a name="valuehere3" title="titlehere" href="/channel/sport/">Link1</a></li>
</ul>';

preg_match_all('/<li><a name="(.*)" title/', $str, $m);
print_r($m);

我对以下代码运气不好。我试图提取<ul class="statelist">(.*) </ul>标签之间的所有数据,但它只返回两个空数组

$data = '<ul class="statelist">
                <li><a href="http://www.mymovingreviews.com/usa/alabama-movers-al-1">Alabama (45)</a></li>
                <li><a href="http://www.mymovingreviews.com/usa/alaska-movers-ak-2">Alaska (4)</a></li>
                <li><a href="http://www.mymovingreviews.com/usa/arizona-movers-az-3">Arizona (113)</a></li>                     
                </ul>';

preg_match_all('/<ul class="statelist">(.*) <\/ul>/', $data, $m);

print_r($m);

1 个答案:

答案 0 :(得分:0)

为正则表达式添加s选项

preg_match_all('/<ul class="statelist">(.*) <\/ul>/s', $data, $m);
                                                              ^^^^ here

它将使你的正则表达式接受单词换行(\ n字符)。 (See the doc