我有一张桌子items
和一张桌子item_attributes
。
为简单起见,我们说我的表格项目有一列id
和一列name
。
对于cource,id
列上有一个索引。
item_attributes
表格包含id
,item_id
,attribute_name
和attribute_value
以及索引attrubute_name
现在我想查询具有特定属性的所有项目而不使用连接。
我使用以下查询执行此操作:
SELECT *
FROM items i
WHERE i.id IN (
SELECT item_id
FROM item_attributes a
WHERE a.attribute_name = 'SomeAttribute'
AND a.attribute_value = 'SomeValue'
)
SubQuery本身运行得很快。
如果我首先执行查询本身并将结果用于IN查询
SELECT *
FROM items i
WHERE i.id IN (1,3,5,7,10,...)
它也很快。
然而,组合查询非常非常慢(> 2秒)。 如果我调查查询计划,我明白为什么:MySQL在items表上执行全表扫描,而不是先执行子查询并使用结果进行索引查询。
1, 'PRIMARY', 'items', 'ALL', '', '', '', '', 149726, 'Using where'
2, 'DEPENDENT SUBQUERY', 'item_attributes', 'index_subquery', 'IDX_ATTRIBUTE_NAME', 'IDX_ATTRIBUTE_NAME', '4', 'func', 1, 'Using where'
有没有办法优化此查询?我知道子查询总是只返回一个小结果集(< 100行)。
答案 0 :(得分:5)
MySQL
无法在IN
子句中切换前导表和从动表。这将是corrected in 6.0
。
现在,您可以像这样重写它(需要JOIN
):
SELECT i.*
FROM (
SELECT DISTINCT item_id
FROM item_attributes a
WHERE a.attribute_name = 'SomeAttribute'
AND a.attribute_value = 'SomeValue'
) ai
JOIN items i
ON i.id = ai.item_id
由于您使用的是EAV
模型,因此您可能希望在(attribute_name, item_id)
上创建唯一索引,在这种情况下,您可以使用普通联接:
SELECT i.*
FROM item_attributes ai
JOIN items i
ON i.id = ai.item_id
WHERE a.attribute_value = 'SomeValue'
AND a.attribute_name = 'SomeAttribute'
答案 1 :(得分:1)
内连接效果更好,效率更高
select i.*
from items i
inner join item_attributes ia on i.id=ia.item_id
where ia.attribute_name='SomeAttribute' AND ia.attribute_value='SomeValue';
如果item_attributes的主键是item_id + attribute_name,则 那么不需要GROUP BY
答案 2 :(得分:0)
您可以使用exists
SELECT *
FROM items i
WHERE Exists
(
SELECT item_id
FROM item_attributes a
WHERE 1=1
AND i.id = a.ItemId
AND a.attribute_name = 'SomeAttribute'
AND a.attribute_value = 'SomeValue'
)
答案 3 :(得分:-1)
SELECT DISTINCT i.*
FROM items i, item_attributes ai
WHERE i.id = ai.item_id AND a.attribute_name = 'SomeAttribute' AND a.attribute_value = 'SomeValue'