正则表达式在html代码php中提取数据

时间:2010-07-29 21:46:25

标签: php regex

如何在此html代码中提取数据

<dl class="col1">
  <dt>Type:</dt>

  <dd><a href="/browse/102" title="More from this category">Audio &gt; Audio books</a></dd>

我需要提取

  

音频&gt; html代码中的音频书籍使用php中的正则表达式

2 个答案:

答案 0 :(得分:3)

你能不能使用XPath?

 $dom = new DOMDocument();
 $dom->loadHTML($yourhtmlstring);
 $x = new DOMXpath($dom);
 foreach($x->query("//dl[@class='col1']/dd/a/text()") as $text) echo htmlentity_decode($text);

答案 1 :(得分:0)

试试这个:

preg_match('/<dd><a[^>]*>(.*)<\/a><\/dd>/', $htmlcode, $matches);
$result = $matches[1];