PHP使用pspell_check从单词中获取单词

时间:2015-07-30 19:59:37

标签: php dictionary spell-checking

我有一个包含英语字样的PHP字符串。我想从字符串中提取所有可能的单词,而不是通过空格explode()提取,因为我只有一个单词。我的意思是从单词中提取单词。

示例:使用"stackoverflow"一词,我需要提取stack, over, flow, overflow所有这些内容。

我正在使用pspell_check()进行拼写检查。我目前正在获得以下组合。

--> sta
--> stac
--> stack
and so on.

所以我发现只有匹配stack的单词,但我想找到以下单词。请注意,我已经不想要最后一个字了。

--> stack
--> over
--> flow

我的代码:

$myword = "stackoverflow";
$word_length = strlen($myword);
$myword_prediction = $myword[0].$myword[1]; 
//(initial condition as words detection starts after 3rd index)

for ($i=2; $i<$word_length; $i++) {
    $myword_prediction .= $myword[$i];
    if (pspell_check(pspell_new("en"), $myword_prediction)) 
    {
        $array[] = $myword_prediction;
    }
}

var_dump($array);

2 个答案:

答案 0 :(得分:2)

如果你有这样的外循环怎么样?第一次通过你从$ myword的第一个字符开始。第二次通过你从第二个角色开始,依此类推。

$myword = "stackoverflow";
$word_length = strlen($myword);

$startLetter = 0;

while($startLetter < $word_length-2 ){
    $myword_prediction = $myword[$startLetter] . $myword[$startLetter +1];
    for ($i=$startLetter; $i<$word_length; $i++) {
        $myword_prediction .= $myword[$i];
        if (pspell_check(pspell_new("en"), $myword_prediction)) {
            $array[] = $myword_prediction;
        }
    }
$startLetter ++;
}

答案 1 :(得分:1)

嗯,您需要获取所有子字符串,并检查每个子字符串:

function get_all_substrings($input){
    $subs = array();
    $length = strlen($input);
    for($i=0; $i<$length; $i++){
        for($j=$i; $j<$length; $j++){
            $subs[] = substr($input, $i, $j);               
        }
    }
    return array_unique($subs);
}

$substrings = get_all_substrings("stackoverflow");
$pspell_link = pspell_new("en");
$words = array_filter($substrings, function($word) use ($pspell_link) {
             return pspell_check($pspell_link, $word);
         });
var_dump($words);