如何在PHP上使用substr_count计算阿拉伯语子字符串

时间:2014-10-11 09:43:44

标签: php mysql substring arabic substr

我正在尝试计算存储在utf8mb4_bin上的MySQL DB文本集中的一组阿拉伯子串。该 php文件也设置为utf-8,所以单词实际上显示正确。

到目前为止,除了阿拉伯语(日语,韩语,泰语,英语等......)之外,我可以计算任何语言的子字符串。但是不能让阿拉伯语工作。

mysqli_query($conn, "SET NAMES utf8mb4");
    $query_main = mysqli_query($conn, "SELECT word FROM lang_dicc WHERE lang = ".$lang." ORDER BY value;");

    while ($query = mysqli_fetch_assoc($query_main) ){
        $vector_1[$i] = mb_substr_count( $text, $query["word"]);
    }

我已将php.ini文件设置为:
mbstring.func_overload = 7

我很困惑因为strpos()实际上可以找到子串......

我疯狂地猜测是写作倒退的事情?我完全迷失了。特别是因为我无法阅读我不知道他们是否倒退的话。

我很感激任何见解。

-Thanks

1 个答案:

答案 0 :(得分:1)

使用mb_substr_count代替。 你需要安装mbstring扩展