使用preg_match php获取包装元素

时间:2012-07-31 05:34:31

标签: php preg-match

我想要一个preg_match代码,它将检测给定的字符串并获取其包装元素。 我有一个字符串和一个HTML代码,如:

$string = "My text";
$html = "<div><p class='text'>My text</p><span>My text</span></div>";

所以我需要创建一个函数来返回包裹字符串的元素,如:

$element = get_wrapper($string, $html);

function get_wrapper($str, $code){
    //code here that has preg_match and return the wrapper element
}

返回的值将是数组,因为它有2个可能的返回值,<p class='text'></p><span></span>

任何人都可以给我一个关于如何获取包装给定字符串的HTML元素的正则表达式模式?

谢谢!非常感谢答案。

3 个答案:

答案 0 :(得分:0)

使用正则表达式完成此任务是个坏主意。您可以使用DOMDocument

$oDom = new DOMDocument('1.0', 'UTF-8');
$oDom->loadXML("<div>" . $sHtml ."</div>");
get_wrapper($s, $oDom);
递归后

function get_wrapper($s, $oDom) {
    foreach ($oDom->childNodes AS $oItem) {
        if($oItem->nodeValue == $s) {
            //needed tag - $oItem->nodeName
        }
        else {
            get_wrapper($s, $oItem);    
        }
    }
}

答案 1 :(得分:0)

简单模式如下,但它假设很多东西。正则表达式不应与这些一起使用。你应该看看更强大的 Simple HTML DOM parser 之类的东西。

无论如何,与包装器标签和周围的html元素匹配的正则表达式如下所示。

 /[A-Za-z'= <]*>My text<[A-Za-z\/>]*/g

答案 2 :(得分:0)

即使正则表达式从不在dom解析领域中的正确答案,我也推出了另一个(非常简单的)解决方案

<[^>/]+?>My String</.+?>

如果html是好的(即它有结束标记,&lt;用&lt;&amp; so替换)。这样,您可以在第一个正则表达式组中使用开始标记,在第二个正则表达式中使用结束标记。