php在sql数据库中找到最匹配的句子

时间:2015-10-09 02:43:26

标签: php mysql sql

我正在回答应用程序的问题,作为其中的一部分,它需要查看存储在SQL数据库中的先前问题并查找具有最匹配单词的先前问题然后它将采用属性来自该行的数据库。

我能够让它为数据库中的每一行生成一系列匹配的单词。但我需要一种组织这些数组的方法来选择匹配最多的数组。这是我用过的SQL和PHP。

$questions1 = $_GET['question'];

$questionsarray =  explode(" ",$questions1);

新问题变成了一个数组,在下面它会与匹配的所有其他问题进行比较

$sql = "SELECT * FROM records WHERE userid= '24.9.71.79'";

$result = $conn->query($sql);

if ($result->num_rows > 0) {

while($row = $result->fetch_assoc()) {

 $questionsasked = $row['old_questions']; 

 // turns old question into an array
 $last_q_array =  explode(" ",$questionsasked);

 //finds matches between the old and new question    
 $intersectarray = array_intersect($last_q_array,$questionsarray);

然后使用array_diff()来清除常用单词,以帮助它专注于找到真正的主题

 $cleanedarray = array_diff($intersectarray ,$commonwords);

 //prints the array if it find matches and sets the var
 if(count($cleanedarray)>0) {

    print_r($cleanedarray);

    $desiredattri = $row[last_answer_type];

    echo "<br />----------------<br />";
 }

}
}

我正在使用print_r进行测试。因此,它可以很好地生成一些只显示匹配单词的数组。看起来像这样

Array ( [3] => card ) 
----------------
Array ( [3] => card [7] => work?  ) 
----------------
Array ( [0] => find [2] => card [7] => work? ) 

所以现在我需要找到一种解析这些数组并找到匹配最多的数组的方法。我可以使用count()来计算每个数组中的匹配,但仍然需要将该数字与其余的数组计数进行比较,然后使用大多数匹配的数组属性。

1 个答案:

答案 0 :(得分:0)

你可以尝试这样的事情。它将使用单词本身作为数组键,数组值是计数。

$result = array();
foreach ($cleanedarray as $word) {
    if (!array_key_exists($word, $result)) {
        $result[$word] = 0;
    }

    $result[$word]++; // keep count using the word as key
}

我确信可能有其他内置的PHP函数可以为你做到这一点,但这是一种快速肮脏的方式来到我身边。