使用PHP mb函数将多字节字符串截断为大约n个单词

时间:2014-09-08 17:04:39

标签: php string multibyte multibyte-functions

在询问this问题之后,我需要准备一个自定义PHP函数来获取我的字符串的简短版本,因为我无法在网上找到直接答案/代码。

要求是:

  1. 了解multibyte language字符,例如şığ UTF-8
  2. 能够确定允许的长度(使用字符数)
  3. 取了长弦的一部分,后面的一个字 字符串必须有意义并且连接' ...'到了最后
  4. 部分
  5. 必须考虑键击(字符),而不是字节
  6. 读者知道代码有效,但我不是专家。我相信通过更高效或更深思的编码可以实现相同的目标。 正如您所看到的,代码没有安全问题,只有在输入字符串超过允许值时才会对其进行操作。

    问候

1 个答案:

答案 0 :(得分:0)

// PrintBrief   : Only introduction words (brief) are printed, multibyte safe
//                IMPORTANT: assumed that no tag has been used in input string
//                output's last word be a meaningful word, no need to worry about erroneous multibyte slicing
// $str         : string    input string to be written briefly
// $max_chars   : number    if string is longer than $max_chars, only first $max_chars will be the source string
// $encoding    : string    multibyte encoding
function PrintBrief ($str , $max_chars = ALLOWED_NUM_OF_CHARS, $encoding = "UTF-8")
{
    mb_regex_encoding($encoding);
    mb_internal_encoding($encoding);
    if ( mb_strlen($str , $encoding) > $max_chars )
    {
        $str = mb_substr($str , 0 , $max_chars , $encoding);
        $w = array();
        $w = mb_split(' ',$str);
        $k = array_pop($w);
        $k = trim(implode(' ', $w));
        $punc = array(';' , ',');
        for ( $i = 1 ; $i <= count($punc) ; $i++ )
        { $k = rtrim($k , $punc[$i] ); }
        return $k.' ...';

    }
    else
    {
        return $str;

    }
}

示例用法:

$str = 'şğıöç İĞŞ ĞŞĞŞ Öİ ÇÇ Orta Amerika\'nın en büyük ülkesi Nikaragua\'nın başkenti Managua dün sabaha karşı büyük bir patlamayla sarsıldı. Olayın, şehre düşen ufak bir meteroit sonucu açılan krater çukurundan kaynaklandığı anlaşıldı. 1 milyon 200 bin kişinin yaşadığı ve bünyesinde ulsulararası bir havalimanının da olduğu şehre meteorit düşmesi sonucu, sürpriz bir şekilde can veya mal kaybı yaşanmadı ancak 12 metre çapında bir krater çukuru açıldı ve patlama neredeyse şehrin tamamında hissedildi.';
用ALLOWED_NUM_OF_CHARS = 300设置

调用后

echo PrintBrief ($str);

输出是:

şğıöçİĞŞĞŞĞŞÖİÇÇOrtaAmerika'nınenbüyükülkesiNikaragua'nınbaşkentiManaguadünsabahakarşıbüyükbirpatlamaylasarsıldı。 Olayın,şehredüşenufakbir meteroitsonucuaçılankraterçukurundankaynaklandığıanlaşıldı。 1 milyon 200binkişininyaşadığıvebünyesindeulsulararasıbir...