将文本修剪为340个字符

时间:2010-01-20 20:21:46

标签: php ellipsis

我正在从数据库中提取博客文章。我想将文本修剪为最多340个字符。

如果博客文章超过340个字符,我想将文本修剪为最后一个完整单词并在末尾添加“...”。

E.g.

NOT: In the begin....

BUT: In the ...

9 个答案:

答案 0 :(得分:26)

看起来你想先将文本精确修剪为340个字符,然后找到字符串中最后一个''的位置并减少到该数量。像这样:

$string = substr($string, 0, 340);
$string = substr($string, 0, strrpos($string, ' ')) . " ...";

答案 1 :(得分:16)

如果您启用了mbstring扩展(现在在大多数服务器上),您可以使用mb_strimwidth函数。

echo mb_strimwidth($string, 0, 340, '...');

答案 2 :(得分:14)

其他答案显示了如何使文本大致 340个字符。如果这对您没问题,那么请使用其他答案之一。

但是如果你想要一个包含340个字符的非常严格的最大,那么其他答案将无效。您需要记住,添加'...'会增加字符串的长度,您需要考虑到这一点。

$max_length = 340;

if (strlen($s) > $max_length)
{
    $offset = ($max_length - 3) - strlen($s);
    $s = substr($s, 0, strrpos($s, ' ', $offset)) . '...';
}

另请注意,我在使用strrpos的重载,它使用偏移量直接从字符串中的正确位置开始搜索,而不是先缩短字符串。

查看在线工作:ideone

答案 3 :(得分:7)

尝试:

preg_match('/^.{0,340}(?:.*?)\b/siu', $text, $matches);
echo $matches[0] . '...';

答案 4 :(得分:2)

我把John Conde的答案放在一个方法中:

function softTrim($text, $count, $wrapText='...'){

    if(strlen($text)>$count){
        preg_match('/^.{0,' . $count . '}(?:.*?)\b/siu', $text, $matches);
        $text = $matches[0];
    }else{
        $wrapText = '';
    }
    return $text . $wrapText;
}

示例:

echo softTrim("Lorem Ipsum is simply dummy text", 10);
/* Output: Lorem Ipsum... */

echo softTrim("Lorem Ipsum is simply dummy text", 33);
/* Output: Lorem Ipsum is simply dummy text */

echo softTrim("LoremIpsumissimplydummytext", 10);
/* Output: LoremIpsumissimplydummytext... */

答案 5 :(得分:0)

您可以尝试使用PHP附带的功能,例如wordwrap

print wordwrap($text,340) . "...";

答案 6 :(得分:0)

function trim_characters($ text,$ length = 340){

$length = (int) $length;
$text = trim( strip_tags( $text ) );

if ( strlen( $text ) > $length ) {
    $text = substr( $text, 0, $length + 1 );
    $words = preg_split( "/[\s]| /", $text, -1, PREG_SPLIT_NO_EMPTY );
    preg_match( "/[\s]| /", $text, $lastchar, 0, $length );
    if ( empty( $lastchar ) )
        array_pop( $words );

    $text = implode( ' ', $words ); 
}

return $text;

}

使用此函数trim_characters()将字符串剪裁为指定数量的字符,优雅地停留在空格处。 我认为这对你有帮助。

答案 7 :(得分:0)

为什么这样?

  • 我喜欢正则表达式解决方案而不是 substring ,以捕捉除空白字断点之外的其他任何内容(interpunction等)
  • John Condoe的解决方案并不完全正确,因为它将文本修剪为340个字符然后完成最后一个字(因此通常会比期望的更长)

实际 regex 解决方案非常简单:

/^(.{0,339}\w\b)/su

PHP中的完整方法可能如下所示:

function trim_length($text, $maxLength, $trimIndicator = '...')
{
        if(strlen($text) > $maxLength) {

            $shownLength = $maxLength - strlen($trimIndicator);

            if ($shownLength < 1) {

                throw new \InvalidArgumentException('Second argument for ' . __METHOD__ . '() is too small.');
            }

            preg_match('/^(.{0,' . ($shownLength - 1) . '}\w\b)/su', $text, $matches);                               

            return (isset($matches[1]) ? $matches[1] : substr($text, 0, $shownLength)) . $trimIndicator ;
        }

        return $text;
}

更多解释:

  • $shownLength是要保持非常严格的限制(如Mark Byers提到的)
  • 如果长度太小,则抛出异常
  • \w\b部分是为了避免结尾处的空格或交互(见下文1)
  • 如果第一个单词的长度大于所需的最大长度,则该单词将被残酷地删除
  1. 尽管问题结果In the ...被描述为所需,但我觉得In the...更顺畅(也不喜欢In the,...等。)

答案 8 :(得分:0)

最简单的解决方案

$text_to_be_trim= "Lorem Ipsum is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industry standard.";
if(strlen($text_to_be_trim) > 20)   
    $text_to_be_trim= substr($text_to_be_trim,0,20).'....';

对于多字节文本

$stringText= "UTIL CONTROL DISTRIBUCION AMARRE CIGÜEÑAL";
$string_encoding = 'utf8';
$s_trunc =  mb_substr($stringText, 0, 37, $string_encoding);
echo $s_trunc;