如何从div类中获取数据?
Example: A <div class=ab>1 2</div>b <div class=ab>3 4</div>c.
我希望:1 2
,3 4
等 - 在<div class=ab>
和</div>
之间。
Second example: http://www.imdb.com/title/tt29747">
我希望:tt29747
- 介于http://www.imdb.com/title/
和">
之间。
strstr 一切都很好,除了我只得到第一个结果。我尝试了一些在这里建立的解决方案,但没有成功,超出我的正则表达。谢谢!
答案 0 :(得分:1)
尝试使用DOMDocument()而不是正则表达式解析HTML。
但是,这里是要解析的正则表达式,假设没有嵌套div
:
$html= 'Example: Lorem <div class=ab>1 2</div>ipsum <div class=ab>3 4</div>dolor.';
preg_match_all('|<div class=ab>([^<]*)</div>|i', $html, $m);
print_r($m[1]);
用于解析标题ID:
$html = 'http://www.imdb.com/title/tt29747">';
preg_match('|imdb.com/title/(tt\d+)|i', $html, $m);
print_r($m[1]);