使用Preg_Split拆分UTF8

时间:2012-02-27 11:08:36

标签: php regex

我有一个阿拉伯语段落需要分成两半。

分隔符是:

معلوماتهامة

我的尝试:

$st = utf8_encode("معلومات هامة");
$info = preg_split('/'.$st.'/', $paragraph);

它没有帮助,我得到了包含整个段落的元素0的数组,所以 info输出与段落输出完全相同。

注意:该段落的换行符和空格不一致。

1 个答案:

答案 0 :(得分:2)

您可以尝试mb_split来处理UTF-8内容。

您也可以尝试将此功能添加到:

mb_internal_encoding( 'UTF-8'); 
mb_regex_encoding( 'UTF-8');