PHP修剪意外行为

时间:2018-05-18 06:56:49

标签: php ascii trim html-entities

我在PHP中使用以下函数修剪一些不需要的字符。

$inputString = "आनन्द मठ";
trim(html_entity_decode($inputString), " \t\n\r\0\x0B\xC2\xA0");

以上代码适用于所有情况,但在一个输入字符串(आनन्द मठ)中,它将其转换为आनन्द म�。它有一个不需要的�。转换为परेटो- श्रेष्ठ的{​​{1}}也正在发生。

2 个答案:

答案 0 :(得分:1)

trim()

此功能使用iso-8859编码。

您必须使用UTF8(Unicode)功能。试试这个功能

function mb_trim($string, $charlist='\\\\s', $ltrim=true, $rtrim=true) 
{ 
    $both_ends = $ltrim && $rtrim; 

    $char_class_inner = preg_replace( 
        array( '/[\^\-\]\\\]/S', '/\\\{4}/S' ), 
        array( '\\\\\\0', '\\' ), 
        $charlist 
    ); 

    $work_horse = '[' . $char_class_inner . ']+'; 
    $ltrim && $left_pattern = '^' . $work_horse; 
    $rtrim && $right_pattern = $work_horse . '$'; 

    if($both_ends) 
    { 
        $pattern_middle = $left_pattern . '|' . $right_pattern; 
    } 
    elseif($ltrim) 
    { 
        $pattern_middle = $left_pattern; 
    } 
    else 
    { 
        $pattern_middle = $right_pattern; 
    } 

    return preg_replace("/$pattern_middle/usSD", '', $string) ); 
} 

答案 1 :(得分:1)

在你的php中添加http标头

header("Content-Type: text/html; charset=ISO-8859-1");

或将编码放在元标记中:

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">