我想要一个preg_match代码,它将检测给定的字符串并获取其包装元素。 我有一个字符串和一个HTML代码,如:
$string = "My text";
$html = "<div><p class='text'>My text</p><span>My text</span></div>";
所以我需要创建一个函数来返回包裹字符串的元素,如:
$element = get_wrapper($string, $html);
function get_wrapper($str, $code){
//code here that has preg_match and return the wrapper element
}
返回的值将是数组,因为它有2个可能的返回值,<p class='text'></p>
和<span></span>
任何人都可以给我一个关于如何获取包装给定字符串的HTML元素的正则表达式模式?
谢谢!非常感谢答案。
答案 0 :(得分:0)
使用正则表达式完成此任务是个坏主意。您可以使用DOMDocument
$oDom = new DOMDocument('1.0', 'UTF-8');
$oDom->loadXML("<div>" . $sHtml ."</div>");
get_wrapper($s, $oDom);
递归后
function get_wrapper($s, $oDom) {
foreach ($oDom->childNodes AS $oItem) {
if($oItem->nodeValue == $s) {
//needed tag - $oItem->nodeName
}
else {
get_wrapper($s, $oItem);
}
}
}
答案 1 :(得分:0)
简单模式如下,但它假设很多东西。正则表达式不应与这些一起使用。你应该看看更强大的 Simple HTML DOM parser 之类的东西。
无论如何,与包装器标签和周围的html元素匹配的正则表达式如下所示。
/[A-Za-z'= <]*>My text<[A-Za-z\/>]*/g
答案 2 :(得分:0)
即使正则表达式从不在dom解析领域中的正确答案,我也推出了另一个(非常简单的)解决方案
<[^>/]+?>My String</.+?>
如果html是好的(即它有结束标记,&lt;用&lt;&amp; so替换)。这样,您可以在第一个正则表达式组中使用开始标记,在第二个正则表达式中使用结束标记。