最佳连接两个MySQL表

时间:2017-02-03 11:10:36

标签: mysql join query-performance

我有一张桌子(T1),大约有。 500000非重复记录:

ID1    Relation  ID2
4      Rel4      13
5      Rel5       4
13     Rel13     16
16     Rel16     5

我有属性表T1_Prop:

ID    Entity    
4     Ent4     
5     Ent5
13    Ent13   
16    Ent16  

我想以有效的方式加入这两个表(基于id:4),如下所示:

 Entity   Relation   Entity
 Ent4      Rel4      Ent13  
 Ent5      Rel5      EntEnt4

我设计了这个包含JOIN的select语句,效果很好。但是,我不确定这是否是最好的方法:

select 
  a.entity, 
  r.relation, 
  b.entity 
from T1 as r 
INNER JOIN T1_Prop as a ON a.ID=r.ID1 AND (r.ID1=4 OR r.ID2=4) 
INNER JOIN T1_Prop as b ON b.ID=r.ID2;

2 个答案:

答案 0 :(得分:0)

这是一个很好用的SQL。它是为这种查询而构建的。

T1上,您需要两个覆盖索引才能加快速度。他们是:

(ID1, ID2, relation)

(ID2, ID1, relation)

这两个索引用于处理OR子句。这是我看到的唯一潜在的性能问题,这只是因为OR操作有时会欺骗查询规划器进行过多的表扫描。

尝试重构您的查询,以便更明显地选择ID值。

select   a.entity, r.relation, b.entity 
  from T1 as r 
 INNER JOIN T1_Prop as a ON a.ID=r.ID1  
 INNER JOIN T1_Prop as b ON b.ID=r.ID2
 WHERE (r.ID1=4 OR r.ID2=4) 

然后,如果您遇到性能问题,在创建覆盖索引后,再次将其重构为

select   a.entity, r.relation, b.entity 
  from T1 as r 
 INNER JOIN T1_Prop as a ON a.ID=r.ID1  
 INNER JOIN T1_Prop as b ON b.ID=r.ID2
 WHERE r.ID1=4 
UNION
select   a.entity, r.relation, b.entity 
  from T1 as r 
 INNER JOIN T1_Prop as a ON a.ID=r.ID1  
 INNER JOIN T1_Prop as b ON b.ID=r.ID2
 WHERE r.ID2=4 

答案 1 :(得分:0)

除第一个ON子句外,您的查询看起来很好。条件(r.ID1=4 OR r.ID2=4)不是T1_Prop加入T1记录的记录的规则。这是一个条件,T1记录要考虑并归属于WHERE子句。

select 
  a.entity AS entity1, 
  r.relation, 
  b.entity AS entity2
FROM t1 AS r 
INNER JOIN t1_prop AS a ON a.id = r.id1
INNER JOIN t1_prop AS b ON b.id = r.id2
WHERE r.id1 = 4 OR r.id2 = 4;

这不会改变执行计划; DBMS将执行此操作。但它更具可读性,因为它显示了实际意图:获得其中一个ID为4的关系,并将实体加入到这些关系中。

显示此意图的另一个选择是:

select 
  a.entity AS entity1, 
  r.relation, 
  b.entity AS entity2
FROM (SELECT * FROM t1 WHERE r.id1 = 4 OR r.id2 = 4) AS r 
INNER JOIN t1_prop AS a ON a.id = r.id1
INNER JOIN t1_prop AS b ON b.id = r.id2;

有些人认为FROM中的子查询不太可读,但是,其他人则不这么认为。当查询变得更复杂并且说您甚至处理来自不同表的聚合时,这通常是构建干净查询的方法。

上述任何一种查询实际上都不比另一种更好或更差。