我在PHP中使用以下函数修剪一些不需要的字符。
$inputString = "आनन्द मठ";
trim(html_entity_decode($inputString), " \t\n\r\0\x0B\xC2\xA0");
以上代码适用于所有情况,但在一个输入字符串(आनन्द मठ
)中,它将其转换为आनन्द म�
。它有一个不需要的�。转换为परेटो- श्रेष्ठ
的{{1}}也正在发生。
答案 0 :(得分:1)
trim()
此功能使用iso-8859编码。
您必须使用UTF8(Unicode)功能。试试这个功能
function mb_trim($string, $charlist='\\\\s', $ltrim=true, $rtrim=true)
{
$both_ends = $ltrim && $rtrim;
$char_class_inner = preg_replace(
array( '/[\^\-\]\\\]/S', '/\\\{4}/S' ),
array( '\\\\\\0', '\\' ),
$charlist
);
$work_horse = '[' . $char_class_inner . ']+';
$ltrim && $left_pattern = '^' . $work_horse;
$rtrim && $right_pattern = $work_horse . '$';
if($both_ends)
{
$pattern_middle = $left_pattern . '|' . $right_pattern;
}
elseif($ltrim)
{
$pattern_middle = $left_pattern;
}
else
{
$pattern_middle = $right_pattern;
}
return preg_replace("/$pattern_middle/usSD", '', $string) );
}
答案 1 :(得分:1)
在你的php中添加http标头
header("Content-Type: text/html; charset=ISO-8859-1");
或将编码放在元标记中:
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">