从div类中获取数据

时间:2014-03-28 22:45:59

标签: php regex preg-match-all

如何从div类中获取数据?

Example: A <div class=ab>1 &nbsp; 2</div>b <div class=ab>3 &nbsp; 4</div>c.

我希望:1 &nbsp; 23 &nbsp; 4等 - 在<div class=ab></div>之间。

Second example: http://www.imdb.com/title/tt29747">

我希望:tt29747 - 介于http://www.imdb.com/title/">之间。

strstr 一切都很好,除了我只得到第一个结果。我尝试了一些在这里建立的解决方案,但没有成功,超出我的正则表达。谢谢!

1 个答案:

答案 0 :(得分:1)

尝试使用DOMDocument()而不是正则表达式解析HTML。

但是,这里是要解析的正则表达式,假设没有嵌套div

$html= 'Example: Lorem <div class=ab>1 &nbsp; 2</div>ipsum <div class=ab>3 &nbsp; 4</div>dolor.';
preg_match_all('|<div class=ab>([^<]*)</div>|i', $html, $m);
print_r($m[1]);

用于解析标题ID:

$html = 'http://www.imdb.com/title/tt29747">';
preg_match('|imdb.com/title/(tt\d+)|i', $html, $m);
print_r($m[1]);