我正在寻找php中文分词
因为中文单词没有空格,会影响全文搜索
离。
$_GET['text']="中文分詞搜尋";
$text=$_GET['text'];(user's input)
$text; -chinese segment function-> $text="中文 分詞 搜尋";(result)
答案 0 :(得分:1)
如果你问谷歌,很容易找到这样的图书馆。
为了确保性能,主要是内核算法以C / C ++等本机语言实现。
还有一个基于RESTful api(使用php界面):
纯PHP实现(可能很慢):
使用php客户端驱动程序的在线Web服务。
答案 1 :(得分:0)
尝试:
<?php
$str = '蚂蚁学院,欢迎您的光临!';
function mbstringtoarray($str,$charset) {
$strlen=mb_strlen($str);
while($strlen){
$array[]=mb_substr($str,0,1,$charset);
$str=mb_substr($str,1,$strlen,$charset);
$strlen=mb_strlen($str);
}
return $array;
}
$arr = mbstringtoarray($str,"gbk");
print_r($arr);
?>
输出将是:
Array
(
[0] => 蚂
[1] => 蚁
[2] => 学
[3] => 院
[4] => ,
[5] => 欢
[6] => 迎
[7] => 您
[8] => 的
[9] => 光
[10] => 临
[11] => !
)
你不能一字一句地划分它: 蚂蚁/学院/欢迎/您/的/光临
如果你坚持,你将需要另一个表来存储这些含义的完整单词,因为php默认不会识别它