PHP中文分词

时间:2014-03-17 02:16:23

标签: php

我正在寻找php中文分词

因为中文单词没有空格,会影响全文搜索

离。

$_GET['text']="中文分詞搜尋";
$text=$_GET['text'];(user's input)
$text; -chinese segment function-> $text="中文 分詞 搜尋";(result)

2 个答案:

答案 0 :(得分:1)

如果你问谷歌,很容易找到这样的图书馆。

为了确保性能,主要是内核算法以C / C ++等本机语言实现。

还有一个基于RESTful api(使用php界面):

纯PHP实现(可能很慢):

使用php客户端驱动程序的在线Web服务。

答案 1 :(得分:0)

尝试:

<?php
$str = '蚂蚁学院,欢迎您的光临!';
function mbstringtoarray($str,$charset) {
  $strlen=mb_strlen($str);
  while($strlen){
    $array[]=mb_substr($str,0,1,$charset);
    $str=mb_substr($str,1,$strlen,$charset);
    $strlen=mb_strlen($str);
  }
  return $array;
}
$arr = mbstringtoarray($str,"gbk");
print_r($arr);
?> 

输出将是:

Array
(
  [0] => 蚂
  [1] => 蚁
  [2] => 学
  [3] => 院
  [4] => ,
  [5] => 欢
  [6] => 迎
  [7] => 您
  [8] => 的
  [9] => 光
  [10] => 临
  [11] => !
)

你不能一字一句地划分它: 蚂蚁/学院/欢迎/您/的/光临

如果你坚持,你将需要另一个表来存储这些含义的完整单词,因为php默认不会识别它