PHP Regex在自定义添加的HTML标记之间查找文本

时间:2010-08-30 16:26:23

标签: php regex

我有以下情景:

获得将用于mailing HTML模板文件。

以下是一个简化示例:

    <table>
<tr>
<td>Heading 1</td>
<td>heading 2</td>
</tr>
<PRODUCT_LIST>
<tr>
<td>Value 1</td>
<td>Value 2</td>
</tr>
</PRODUCT_LIST>
</table>

我需要做的就是在<PRODUCT_LIST>中获取HTML代码,然后重复该代码,就像我在数组上的产品一样。

获取/替换此列表的正确PHP Regex代码是什么?

谢谢!

5 个答案:

答案 0 :(得分:38)

假设<PRODUCT_LIST>标签永远不会嵌套

preg_match_all('/<PRODUCT_LIST>(.*?)<\/PRODUCT_LIST>/s', $html, $matches);

//HTML array in $matches[1]
print_r($matches[1]);

答案 1 :(得分:9)

使用Simple HTML DOM Parser。它易于理解和使用。

$html = str_get_html($content);
$el = $html->find('PRODUCT_LIST', 0);
$innertext = $el->innertext;

答案 2 :(得分:3)

使用此功能。它会将所有找到的值作为数组返回。

<?php
function get_all_string_between($string, $start, $end)
{
    $result = array();
    $string = " ".$string;
    $offset = 0;
    while(true)
    {
        $ini = strpos($string,$start,$offset);
        if ($ini == 0)
            break;
        $ini += strlen($start);
        $len = strpos($string,$end,$ini) - $ini;
        $result[] = substr($string,$ini,$len);
        $offset = $ini+$len;
    }
    return $result;
}

$result = get_all_string_between($input_string, '<PRODUCT_LIST>', '</PRODUCT_LIST>');

答案 3 :(得分:2)

如上所述,但表现真的太可怕了 如果你可以使用PHP 5,你可以使用这样的DOM对象:

     <?php
      function getTextBetweenTags($tag, $html, $strict=0)
    {
     /*** a new dom object ***/
    $dom = new domDocument;

    /*** load the html into the object ***/
    if($strict==1)
    {
        $dom->loadXML($html);
    }
    else
    {
        $dom->loadHTML($html);
    }

    /*** discard white space ***/
    $dom->preserveWhiteSpace = false;

    /*** the tag by its tag name ***/
    $content = $dom->getElementsByTagname($tag);

    /*** the array to return ***/
    $out = array();
    foreach ($content as $item)
    {
        /*** add node value to the out array ***/
        $out[] = $item->nodeValue;
    }
    /*** return the results ***/
    return $out;
}
?>

并在添加此功能后您可以将其用作:

$content = getTextBetweenTags('PRODUCT_LIST', $your_html);

foreach( $content as $item )
{
    echo $item.'<br />';
}
?>
是的,我今天才知道这一点。不要使用带有php5的html的preg

答案 4 :(得分:0)

regular expression

中试试preg match all function
<PRODUCT_LIST>(.*?)<\/PRODUCT_LIST>