mysql表性能升级(索引

时间:2015-05-21 21:32:48

标签: mysql performance

我正在尝试找到一种方法来提高包含ip范围的mysql表的性能(它在高峰时段每秒最多会有500个SELECT查询(!),所以我很担心)。

我有一个这种结构的表格:

id  smallint(5) Auto Increment   
ip_start    char(16)     
ip_end  char(16)

编码是utf8_general_ci(在整个表和除id之外的每个列),表是MyISAM的类型(只有SELECT查询,此处不需要插入/删除)。此表的索引为PRIMARY id

在这个momen表上有近2000行。所有这些都包含ip的范围。 例如:

ip_start 128.6.230.0
ip_end 128.6.238.255

当用户访问某个网站时,我正在检查他的ip是否在我表格中的某些范围内。我使用这个查询(dibi sql库):

 SELECT COUNT(*)
 FROM ip_ranges
 WHERE %s", $user_ip, " BETWEEN ip_start AND ip_end

如果查询结果不为零,那么用户的ip就在表中的其中一个范围内 - 这就是我需要它做的全部。

我在考虑将一些索引放到该表中?但我不太确定它是如何工作的,如果它是一个好主意(因为可能没有什么可以真正索引,对吧?大多数ip范围都不同)。

我在ip_start和ip_end列上也有varchar类型,但是我将它切换为char(猜猜它更快?)。

有关于如何进一步改进此表/查询的任何想法吗?

1 个答案:

答案 0 :(得分:1)

您不想使用聚合。而是检查以下内容是否返回任何行:

 SELECT 1
 FROM ip_ranges
 WHERE %s", $user_ip, " BETWEEN ip_start AND ip_end
 LIMIT 1;

LIMIT 1表示在第一场比赛时停止,因此速度更快。

对于此查询,您需要ip_ranges(ip_start, ip_end)上的索引。

当没有匹配时,这仍然存在性能问题。必须扫描在测试ip之后的整个索引。我认为以下内容应该是一种改进:

SELECT COUNT(*)
FROM (SELECT i.start, ip_end
      FROM ip_ranges i
      WHERE %s", $user_ip, " >= ip_start
      ORDER BY ip_start
      LIMIT 1
     ) i
WHERE $user_ip <= ip_end;

内部子查询应该使用索引但是拉回第一个匹配。然后外部查询应该检查范围的结束。这里count(*)没问题,因为只有一行。