我开发了一个相当简单的脚本来搜索数据库,然后根据使用的搜索词对结果进行排序,因此首先尝试获得最相关的结果。
现在这个在我的本地机器上运行良好,在我输入排序之前,我已经雇用的网络服务器运行正常但是一旦搜索时间的排序在网络服务器上大大增加。
我在下面发布的内容我已经根据我知道的方式进行了优化,所以我正在寻找一些更好的排序算法的帮助,甚至可能更好地查询数据库,以帮助加快排序时间!
现在一些关于我正在使用的信息我需要允许搜索3个字母或更多字母,例如cat或car,我无法更改mysql服务器的自然搜索字长度限制,所以我无法使用自然语言搜索mysql因此我正在进行我目前的查询。
此外,平均搜索可以轻松返回100-15000个结果之间的任何地方,数据库包含大约20000个条目
非常感谢任何帮助
<?php
require_once 'config.php';
$bRingtone = true;
$aSearchStrings = $_POST["searchStrings"];
$cConnection = new mysqli($dbhost, $dbuser, $dbpass, $dbname);
if (mysqli_connect_errno())
{
exit();
}
$sTables = array("natural", "artificial", "musical", "created");
$aQueries = array();
foreach ($sTables as $sTable)
{
$sQuery = "SELECT filename, downloadPath, description, imageFilePath, keywords FROM `$sTable` WHERE";
$sParamTypes = "";
$aParams = array();
$iCount = 0;
foreach ($aSearchStrings as $sString)
{
$sParamTypes .= "ss";
$aParams[] = "%,$sString%";
$aParams[] = "$sString%";
$sQuery .= $iCount++ == 0 ? " (keywords LIKE ? OR keywords LIKE ?)" : " AND (keywords LIKE ? OR keywords LIKE ?)";
}
array_unshift($aParams, $sParamTypes);
$aQueries[$sQuery] = $aParams;
}
$aResults = array();
foreach ($aQueries as $sQuery => $aParams)
{
if ($cStmt = $cConnection->prepare($sQuery))
{
$aQueryResults = array();
call_user_func_array(array($cStmt, 'bind_param'), $aParams);
$cStmt->execute();
$cStmt->bind_result($sFileName, $sDownloadPath, $sDescription, $sImageFilePath, $sKeywords);
while($cStmt->fetch())
{
if ($bRingtone)
{
$sFileName = $_SERVER['DOCUMENT_ROOT'] . "/m4r/" . str_replace(".WAV", ".M4R", $sFileName);
if (file_exists($sFileName))
{
$sDownloadPath = str_replace("Sounds", "m4r", str_replace(".WAV", ".M4R", $sDownloadPath));
$aResults[$sDownloadPath] = array($sDownloadPath, $sDescription, $sImageFilePath, $sKeywords, $aSearchStrings);
}
}
}
$aResults = array_merge($aResults, $aQueryResults);
$cStmt->close();
}
}
$cConnection->close();
$aResults = array_values($aResults);
function in_arrayi($needle, $haystack) {
return in_array(strtolower($needle), array_map('strtolower', $haystack));
}
function keywordSort($a, $b)
{
if ($a[0] === $b[0]) return 0;
$aKeywords = explode(",", $a[3]);
$bKeywords = explode(",", $b[3]);
foreach ($a[4] as $sSearchString)
{
$aFound = in_arrayi($sSearchString, $aKeywords);
$bFound = in_arrayi($sSearchString, $bKeywords);
if ($aFound && !$bFound)
{
return -1;
}
else if ($bFound && !$aFound)
{
return 1;
}
}
return 0;
}
usort($aResults, "keywordSort");
foreach ($aResults as &$aResult)
{
unset($aResult[3]);
unset($aResult[4]);
}
echo json_encode($aResults);
?>
答案 0 :(得分:2)
在必须拆分字段代码端时对大量数据进行排序会很慢。我没有优化,而是认真地推荐另一种方法,比如全文索引。一旦它正常工作,它真的很整洁。
如果全文确实不是一个选项,我建议将关键字拆分为单独的表格。这样,您可以根据分组后的计数进行排序。例如......
SELECT d.*, COUNT(k.id) AS keywordcount
FROM data d
INNER JOIN keywords k ON (d.id = k.dataid)
WHERE k.value IN ('keyword1', 'keyword2', 'keyword3')
GROUP BY d.id
ORDER BY keywordcount
在另一个PSish类型的注释中,您可以通过UNIONing选择加速,然后排序,而不是单独运行它们。