MySQL优化了多个内连接

时间:2016-07-15 14:10:10

标签: mysql join

可能这是地球上最懒的mySQL查询。我并不假装自己是这方面的专家 - 我依靠社区来支持。

我需要在查询中运行两个表。一个表必须内部连接在一起以提取链接的两端,然后需要使用第二个表来提取地理坐标。不确定首先要做哪一个。需要进行一些地理切割 - 但这可能是另一天的问题。

过滤应在FREQUENCY字段和LONG / LAT框中完成。但最重要的是,必须将同一个表DEVICE_DETAILS的列连接在一起才能转换为:

Side A ,,,,

Side B ,,,,

TO:

A面,B面,,,,,

join on statement应该更好地解释一下:

查询是:

SELECT T.EFL_SYSTEM AS TX_EFL_SYSTEM,
          T.SITE_ID AS TX_SITE_ID,
          T.FREQUENCY AS TX_FREQUENCY, 
          T.DEVICE_TYPE AS TX_DEVICE_TYPE,
          T.EIRP AS TX_EIRP,
          T.LONGITUDE AS TX_LON,
          T.LATITUDE AS TX_LAT,
          R.EFL_SYSTEM AS RX_EFL_SYSTEM,
          R.SITE_ID AS RX_SITE_ID,
          R.FREQUENCY AS RX_FREQUENCY,
          R.DEVICE_TYPE AS RX_DEVICE_TYPE,
          R.EIRP AS RX_EIRP,
          ST.LONGITUDE,
          ST.LATITUDE,
          SR.LONGITUDE,
          SR.LATITUDE
  FROM DEVICE_DETAILS T
  INNER JOIN DEVICE_DETAILS R ON (T.EFL_SYSTEM=R.EFL_SYSTEM) AND (T.FREQUENCY=R.FREQUENCY) AND (T.DEVICE_TYPE != R.DEVICE_TYPE)
  INNER JOIN SITE ST ON T.SITE_ID = ST.SITE_ID
  INNER JOIN SITE SR ON R.SITE_ID = SR.SITE_ID
  WHERE T.FREQUENCY > 7425000000 AND T.FREQUENCY < 7525000000 AND R.FREQUENCY > 7425000000 AND R.FREQUENCY < 7525000000 AND T.DEVICE_TYPE = 'T';

这些是表格:

CREATE TABLE `SITE` (
    `SITE_ID` VARCHAR(31) NOT NULL,
    `LATITUDE` DECIMAL(18,14) NOT NULL,
    `LONGITUDE` DECIMAL(18,14) NOT NULL,
    `NAME` VARCHAR(1023) NOT NULL,
    `STATE` VARCHAR(80) NOT NULL,
    `LICENSING_AREA_ID` INT(3) NOT NULL,
    `POSTCODE` VARCHAR(18) NOT NULL,
    `SITE_PRECISION` VARCHAR(31) NOT NULL,
    `ELEVATION` INT(5) NOT NULL
)
COLLATE='latin1_swedish_ci'
ENGINE=InnoDB
;

对于DEVICE_DETAILS表;缺少一些领域,但这些是基本的。没有主键可能是因为我每天早上都进行CSV批量导入。我想我必须在稍后阶段优化这部分

+--------------------------------+----------------+------+-----+---------+-------+
| Field                          | Type           | Null | Key | Default |    Extra|
+--------------------------------+----------------+------+-----+---------+-------+
| SDD_ID                         | int(10)        | NO   |     | NULL    ||
| FREQUENCY                      | bigint(20)     | NO   |     | NULL    ||
| BANDWIDTH                      | int(15)        | NO   |     | NULL    ||
| CARRIER_FREQ                   | bigint(20)     | NO   |     | NULL    ||
| EMISSION                       | varchar(63)    | NO   |     | NULL    ||
| DEVICE_TYPE                    | varchar(1)     | NO   |     | NULL    ||
| TRANSMITTER_POWER              | int(20)        | NO   |     | NULL    ||
| SITE_ID                        | varchar(31)    | NO   |     | NULL    |||
| EFL_SYSTEM                     | varchar(63)    | NO   |     | NULL    ||
+--------------------------------+----------------+------+-----+---------+-------+

在这方面有任何意见或评论。

问题:

1-这些多个INNER JOINS是否良好实践?还有哪些其他选择可以优化它 2-我从CSV使用INFILE输入(每天);我无法使用源格式。我还可以添加索引吗?它会影响进口吗?还有什么需要优化索引方法吗? 3-我可以通过指定长/拉矩形边界在SITE表上添加过滤器 - 这有助于优化操作吗?我应该在哪里添加这些条件

注意:我的SITE表约为11.5MB,DEVICE_DETAILS约为232.8 MB。我有8GB的RAM和8个线程处理器。

1 个答案:

答案 0 :(得分:0)

您可以通过在表格中添加INDEXES来进行优化。

在此处阅读更多内容:http://dev.mysql.com/doc/refman/5.7/en/mysql-indexes.html

在我的头顶,没有看到你的数据(这是非常重要的),我建议为主要的WHERE和JOIN子句添加索引:

foo

另外,我认为你可能有一个错误(不是为了优化) - 如果JOIN到ST有这个ON子句:

ALTER TABLE DEVICE_DETAILS ADD INDEX FREQUENCY (FREQUENCY), ADD INDEX DEVICE_TYPE (DEVICE_TYPE), ADD INDEX SITE_ID (SITE_ID);
ALTER TABLE SITE ADD INDEX SITE_ID (SITE_ID);

而不是:

ON T.SITE_ID = ST.SITE_ID