我目前正在开展一个项目,要求我扫描Public Whip Raw Data并返回MP名称列表(他们投票选择了与输入的关键字相匹配的政策,例如“狐狸狩猎”)。当前的SQL查询大约需要30秒才能完成执行,这太长了。
这是查看“距离”表和“策略”表的SQL查询。 (这是执行时间太长的事情)
$sql = "SELECT DISTINCT distance.mp_id from distance WHERE distance.distance < 0.2 AND distance.dream_id IN (SELECT dream_id from policy WHERE UPPER(policy.title) LIKE UPPER('%".$keyword."%')) ORDER BY distance.distance LIMIT 5";
这是其他代码,只是回显了mp名称
$results = mysql_query($sql);
echo "<ul>";
while ($row = mysql_fetch_array($results)) {
$mpid = $row['mp_id'];
$sql = "SELECT mp.first_name,mp.last_name FROM mp WHERE mp_id = ".$mpid;
$result = mysql_query($sql);
$result = mysql_fetch_assoc($result);
echo "<li>".$result['first_name']." ".$result['last_name']."</li>\n";
}
echo "</ul>";
答案 0 :(得分:1)
这是您的查询:
SELECT DISTINCT distance.mp_id
from distance
WHERE distance.distance < 0.2 AND
distance.dream_id IN (SELECT dream_id
from policy
WHERE UPPER(policy.title) LIKE UPPER('%".$keyword."%')
)
ORDER BY distance.distance
LIMIT 5;
在某些版本的MySQL中,带有子查询的in
效率低下。我还假设mp_id
对于表distance
是唯一的。此查询可能会更好:
SELECT d.mp_id
from distance d
WHERE d.distance < 0.2 AND
exists (select 1
from policy p
where UPPER(p.title) LIKE UPPER('%".$keyword."%') and
p.dream_id = d.dream_id
)
ORDER BY d.distance
LIMIT 5;
通过在policy(dream_id)
和distance(distance)
上建立索引,可以进一步改进此查询。
根据策略表的大小,性能的一个主要障碍是表达式UPPER(policy.title) LIKE UPPER('%".$keyword."%')
。如果你的意思是平等,那么使用相等而不是like
和通配符。如果您确实在title
列中存储了多个关键字,请考虑将这些关键字分解为单独的表格或使用全文搜索。