捕获HTML标记中的单词

时间:2013-07-10 05:16:24

标签: php regex

我想知道在HTML文本表达式中捕获关键字的最常规优化是什么。 请注意,我使用的是PHP。

我有一段像这样的HTML代码:

...
<li><span class="fl">
Dish</span>
<div class="oflow">
<span class="1F4446484E1FCB4FC3C21FC04AC6C21E232020211F underline">
pasta</span>
, <span class="1F4446484E1FCB4FC3C21FC04AC6C21E23202A251F underline">
rice</span>
, <span class="1F4446484E1FCB4FC3C21FC04AC6C21E2320202B1F underline">
potatoes</span>
</div>
</li>
...

我想选择可用的菜肴(意大利面,米饭和土豆),知道唯一一个总是相同的词是“Dish”,并且每个关键词之间始终存在跨度,我将会恢复。

提前谢谢。

1 个答案:

答案 0 :(得分:0)

<?php 
    var $aDishes = explode(',', strip_tags($sHtml));
?>