PHP限制文本字符串不包括html标签?

时间:2010-07-01 21:00:40

标签: php substr

这是什么对我不起作用:

<?php
 $string = 'I have a dog and his name is <a href="http://www.jackismydog.com">Jack</a> and I love him very much because he\'s my favorite dog in the whole wide world and nothing could make me not love him, I think.';
 $limited = substr($string, 0, 100).'...';
 echo $string;
?>

我想将VISIBLE文本限制为100个字符,但使用substr()还包括限制中的不可见文本(<a href="http://www.jackismydog.com"></a>),其中包含41个那些可用的100个字符。

有没有办法限制文字,以便链接中的“杰克”一词会包含在限制中,但不包括<a href="http://www.jackismydog.com"></a>

编辑: 我想把链接保留在字符串中,只是不计算它的长度达到极限..

5 个答案:

答案 0 :(得分:4)

截断HTML代码中的单词的函数:

//+ Jonas Raoni Soares Silva
//@ http://jsfromhell.com
function truncate($text, $length, $suffix = '&hellip;', $isHTML = true) {
    $i = 0;
    $simpleTags=array('br'=>true,'hr'=>true,'input'=>true,'image'=>true,'link'=>true,'meta'=>true);
    $tags = array();
    if($isHTML){
        preg_match_all('/<[^>]+>([^<]*)/', $text, $m, PREG_OFFSET_CAPTURE | PREG_SET_ORDER);
        foreach($m as $o){
            if($o[0][1] - $i >= $length)
                break;
            $t = substr(strtok($o[0][0], " \t\n\r\0\x0B>"), 1);
            // test if the tag is unpaired, then we mustn't save them
            if($t[0] != '/' && (!isset($simpleTags[$t])))
                $tags[] = $t;
            elseif(end($tags) == substr($t, 1))
                array_pop($tags);
            $i += $o[1][1] - $o[0][1];
        }
    }

    // output without closing tags
    $output = substr($text, 0, $length = min(strlen($text),  $length + $i));
    // closing tags
    $output2 = (count($tags = array_reverse($tags)) ? '</' . implode('></', $tags) . '>' : '');

    // Find last space or HTML tag (solving problem with last space in HTML tag eg. <span class="new">)
    $pos = (int)end(end(preg_split('/<.*>| /', $output, -1, PREG_SPLIT_OFFSET_CAPTURE)));
    // Append closing tags to output
    $output.=$output2;

    // Get everything until last space
    $one = substr($output, 0, $pos);
    // Get the rest
    $two = substr($output, $pos, (strlen($output) - $pos));
    // Extract all tags from the last bit
    preg_match_all('/<(.*?)>/s', $two, $tags);
    // Add suffix if needed
    if (strlen($text) > $length) { $one .= $suffix; }
    // Re-attach tags
    $output = $one . implode($tags[0]);

    //added to remove  unnecessary closure
    $output = str_replace('</!-->','',$output); 

    return $output;
}

来源:http://snippets.dzone.com/posts/show/7125

答案 1 :(得分:3)

不容易 - 你当然可以使用strip_tags去除字符串,但除此之外没有简单的解决方法。

答案 2 :(得分:3)

最简单的方法是将其解析为DOM结构。您可以使用DOMDocument。然后,您可以简单地浏览元素并对内容进行任何更改。

另一种方法是进行两遍正则表达式搜索和替换 - 首先使用正则表达式查找标记的内容,然后使用正则表达式用缩短的内容替换内容。这可以通过常用的preg_ *函数来实现。

答案 3 :(得分:2)

如果要限制文本部分,则需要解析它并自行检查限制。最简单的方法是:

if ( strlen(strip_tags($string)) > 100 )
{
    // the url inside $url is too big
}
else
{
    // the url inside $url fits
}

答案 4 :(得分:1)

你可以试试这个,如果没有标签在字符串中,我可以使用$ different将值为0,给$ stringsize你的原始值为100

  <?php
$string = 'I have a dog and his name is <a href="http://www.jackismydog.com">Jack</a> and I love him very much because he\'s my favorite dog in the whole wide world and nothing could make me not love him, I think.';

$stringall=strlen($string);
$striphtml = strip_tags($string);
$stringnohtml=strlen(striphtml);
$differ=($stringall-$stringnohtml);
$stringsize=($differ + 100);
$limited = substr($string, 0, $stringsize).'...';
echo $limited;
?>