从非常大的SQL表中选择记录子集

时间:2012-10-08 14:42:52

标签: mysql sql database-performance

有两个表,即LongTableShortTable。例如,LongTable看起来像:

personA | personB
1 | 2
1 | 3
2 | 4
2 | 5
3 | 4
3 | 5
3 | 6
4 | 5
4 | 6

ShortTable具有以下内容:

PersonA
1
2

我想知道如何根据LongTable中的记录从ShortTable中选择记录(请注意,此表格很长,即大约2.000.000行)。因此,这种特殊情况的结果应该是:

personA | personB
1 | 2
1 | 3
2 | 4
2 | 5

我开始使用以下查询(但失败:“无法重新打开表:'ShortTable'”):

SELECT * FROM LongTable
  WHERE
    personA IN (SELECT * FROM ShortTable)
    AND
    personB IN (SELECT * FROM ShortTable)

下面给出了重现临时表的代码。

提前感谢任何指针。

CREATE TABLE LongTable (
  personA INT,
  personB INT
);

INSERT INTO LongTable VALUES
(1,2),(1,3),(2,4),
(2,5),(3,4),(3,5),
(3,6),(4,5),(4,6);

CREATE TABLE ShortTable (
  personA INT
);

INSERT INTO ShortTable VALUES
(1),(2);

3 个答案:

答案 0 :(得分:2)

试试这个

 SELECT DISTINCT l.personA, l.personB
 FROM longTable l 
 INNER JOIN ShortTable s ON l.personA  = s.personA 

答案 1 :(得分:1)

您可以使用:

SELECT * FROM LongTable
WHERE personA IN (SELECT * FROM ShortTable)

请注意,运行时间通常取决于表结构(例如索引),而不是查询

答案 2 :(得分:1)

在MySQL中执行此操作的最快方法是在longTable.personA上创建索引。然后执行以下查询:

select l.personA, l.personB
from longTable l
where exists (select 1 from shortTable s where s.PersonA = l.PersonA limit 1)