我正在尝试找到一种方法来提高包含ip范围的mysql表的性能(它在高峰时段每秒最多会有500个SELECT查询(!),所以我很担心)。
我有一个这种结构的表格:
id smallint(5) Auto Increment
ip_start char(16)
ip_end char(16)
编码是utf8_general_ci
(在整个表和除id之外的每个列),表是MyISAM的类型(只有SELECT查询,此处不需要插入/删除)。此表的索引为PRIMARY id
。
在这个momen表上有近2000行。所有这些都包含ip的范围。 例如:
ip_start 128.6.230.0
ip_end 128.6.238.255
当用户访问某个网站时,我正在检查他的ip是否在我表格中的某些范围内。我使用这个查询(dibi sql库):
SELECT COUNT(*)
FROM ip_ranges
WHERE %s", $user_ip, " BETWEEN ip_start AND ip_end
如果查询结果不为零,那么用户的ip就在表中的其中一个范围内 - 这就是我需要它做的全部。
我在考虑将一些索引放到该表中?但我不太确定它是如何工作的,如果它是一个好主意(因为可能没有什么可以真正索引,对吧?大多数ip范围都不同)。
我在ip_start和ip_end列上也有varchar类型,但是我将它切换为char(猜猜它更快?)。
有关于如何进一步改进此表/查询的任何想法吗?
答案 0 :(得分:1)
您不想使用聚合。而是检查以下内容是否返回任何行:
SELECT 1
FROM ip_ranges
WHERE %s", $user_ip, " BETWEEN ip_start AND ip_end
LIMIT 1;
LIMIT 1
表示在第一场比赛时停止,因此速度更快。
对于此查询,您需要ip_ranges(ip_start, ip_end)
上的索引。
当没有匹配时,这仍然存在性能问题。必须扫描在测试ip之后的整个索引。我认为以下内容应该是一种改进:
SELECT COUNT(*)
FROM (SELECT i.start, ip_end
FROM ip_ranges i
WHERE %s", $user_ip, " >= ip_start
ORDER BY ip_start
LIMIT 1
) i
WHERE $user_ip <= ip_end;
内部子查询应该使用索引但是拉回第一个匹配。然后外部查询应该检查范围的结束。这里count(*)
没问题,因为只有一行。