此代码
print mb_substr('éxxx', 0, 1);
打印一个空格:(
应该打印第一个字符é
。但这似乎有效:
print mb_substr('éxxx', 0, 2);
但这不对,因为(0,2)表示2个字符......
答案 0 :(得分:47)
尝试将encoding参数传递给mb_substr,如下所示:
print mb_substr('éxxx', 0, 1, 'utf-8');
永远不会自动检测到编码。
答案 1 :(得分:13)
在实践中,我发现在某些系统中,多字节函数默认为ISO-8859-1用于内部编码。这实际上破坏了他们处理多字节文本的能力。
设置一个好的默认值可能会解决这个问题以及其他一些问题:
mb_internal_encoding('UTF-8');