在php中使用正则表达式匹配或任何其他方式拆分unicode单词

时间:2016-01-06 20:08:09

标签: php regex

需要从unicode字符串中搜索n分割特定部分,例如,如果单词是لاحاصل,需要在匹配形状中搜索لا,如حاصل和لا任何帮助吗?

1 个答案:

答案 0 :(得分:1)

您可以将preg_splitu修饰符一起使用以获得多字节支持。然后你可以使用第四个参数指定你想要分隔符和分隔部分:

$word = "لاحاصل";
$entry = "لا";
$arr = preg_split("/($entry)/u", $word, null,
                  PREG_SPLIT_DELIM_CAPTURE + PREG_SPLIT_NO_EMPTY); 
echo $arr[0] . "<br>"; // لا
echo $arr[1] . "<br>"; // حاصل

不要忘记 $ entry 周围的括号,使其成为捕获组。这种方式适用于PREG_SPLIT_DELIM_CAPTURE