避免" filesort"关于UNION RESULT

时间:2016-04-03 18:20:46

标签: mysql indexing query-optimization filesort

子查询1:

SELECT * from big_table
where category = 'fruits' and name = 'apple'
order by yyyymmdd desc

说明:

table       |   key           |   extra
big_table   |   name_yyyymmdd |   using where

看起来很棒!

子查询2:

SELECT * from big_table
where category = 'fruits' and (taste = 'sweet' or wildcard = '*')
order by yyyymmdd desc

说明:

table       |   key               |   extra
big_table   |   category_yyyymmdd |   using where

看起来很棒!

现在,如果我将这些与UNION结合起来:

SELECT * from big_table
where category = 'fruits' and name = 'apple'

UNION

SELECT * from big_table
where category = 'fruits' and (taste = 'sweet' or wildcard = '*')

Order by yyyymmdd desc

说明:

table       |   key      |   extra
big_table   |   name     |   using index condition, using where
big_table   |   category |   using index condition
UNION RESULT|   NULL     |   using temporary; using filesort

不太好,它使用filesort。

这是一个更复杂的查询的精简版本,这里有一些关于big_table的事实:

  • big_table有10M +行
  • 有5个独特的"类别" s
  • 有5种独特的"味道" s
  • 大约有10,000个名字" s
  • 大约有10,000个独特的" yyyymmdd" s
  • 我在每个字段上创建了单个索引,加上复合idx,例如yyyymmdd_category_taste_name,但Mysql没有使用它。

2 个答案:

答案 0 :(得分:0)

这也必须在没有UNION的情况下工作

SELECT * from big_table
where 
    ( category = 'fruits' and name = 'apple' )
    OR
    ( category = 'fruits' and (taste = 'sweet' or wildcard = '*')
ORDER BY yyyymmdd desc;

答案 1 :(得分:0)

SELECT * FROM big_table
    WHERE category = 'fruits'
      AND (  name = 'apple'
          OR taste = 'sweet'
          OR wildcard = '*' )
    ORDER BY yyyymmdd DESC

INDEX(catgory)或某些索引category开头。但是,如果超过约20%的表category = 'fruits',可能会决定忽略该索引,只需执行表扫描。 (因为你说只有5个类别,我怀疑优化器会正确地避开索引。)

或者可能有益:INDEX(category, yyyymmdd)顺序。

UNION必须进行排序(在磁盘上的内存中,目前尚不清楚),因为它无法按所需顺序获取行。

复合索引INDEX(yyyymmdd, ...)可能用于避免'filesort',但它不会使用yyyymmdd之后的任何列。

构建复合索引时, start ,其中任何WHERE列与'='进行比较。之后,您可以添加一个范围或group byorder byMore details

UNION通常是避免慢OR的好选择,但在这种情况下需要三个索引

INDEX(category, name)
INDEX(category, taste)
INDEX(category, wildcard)

除非添加LIMIT,否则添加yyyymmdd无济于事。

查询将是:

( SELECT * FROM big_table WHERE category = 'fruits' AND name = 'apple' )
UNION DISTINCT
( SELECT * FROM big_table WHERE category = 'fruits' AND taste = 'sweet' )
UNION DISTINCT
( SELECT * FROM big_table WHERE category = 'fruits' AND wildcard = '*' )
ORDER BY yyyymmdd DESC

添加限制甚至会更加混乱。首先在三个复合索引的 end 上添加yyyymmdd,然后

( SELECT ... ORDER BY yyyymmdd DESC LIMIT 10 )
UNION DISTINCT
( SELECT ... ORDER BY yyyymmdd DESC LIMIT 10 )
UNION DISTINCT
( SELECT ... ORDER BY yyyymmdd DESC LIMIT 10 )
ORDER BY yyyymmdd DESC  LIMIT 10

添加OFFSET会更糟糕。

另外两种技术 - “覆盖”索引和“懒惰查找”可能有所帮助,但我对此表示怀疑。

另一种技术是将所有单词放在同一列中并使用FULLTEXT索引。但由于几个原因,这可能会有问题。