PHP mb_substr()无法正常工作?

时间:2012-12-19 13:15:48

标签: php string utf-8 multibyte mbstring

此代码

print mb_substr('éxxx', 0, 1);

打印一个空格:(

应该打印第一个字符é。但这似乎有效:

print mb_substr('éxxx', 0, 2);

但这不对,因为(0,2)表示2个字符......

2 个答案:

答案 0 :(得分:47)

尝试将encoding参数传递给mb_substr,如下所示:

print mb_substr('éxxx', 0, 1, 'utf-8');

永远不会自动检测到编码。

答案 1 :(得分:13)

在实践中,我发现在某些系统中,多字节函数默认为ISO-8859-1用于内部编码。这实际上破坏了他们处理多字节文本的能力。

设置一个好的默认值可能会解决这个问题以及其他一些问题:

mb_internal_encoding('UTF-8');