可能这是地球上最懒的mySQL查询。我并不假装自己是这方面的专家 - 我依靠社区来支持。
我需要在查询中运行两个表。一个表必须内部连接在一起以提取链接的两端,然后需要使用第二个表来提取地理坐标。不确定首先要做哪一个。需要进行一些地理切割 - 但这可能是另一天的问题。
过滤应在FREQUENCY字段和LONG / LAT框中完成。但最重要的是,必须将同一个表DEVICE_DETAILS的列连接在一起才能转换为:
Side A ,,,,
Side B ,,,,
TO:
A面,B面,,,,,
join on statement应该更好地解释一下:
查询是:
SELECT T.EFL_SYSTEM AS TX_EFL_SYSTEM,
T.SITE_ID AS TX_SITE_ID,
T.FREQUENCY AS TX_FREQUENCY,
T.DEVICE_TYPE AS TX_DEVICE_TYPE,
T.EIRP AS TX_EIRP,
T.LONGITUDE AS TX_LON,
T.LATITUDE AS TX_LAT,
R.EFL_SYSTEM AS RX_EFL_SYSTEM,
R.SITE_ID AS RX_SITE_ID,
R.FREQUENCY AS RX_FREQUENCY,
R.DEVICE_TYPE AS RX_DEVICE_TYPE,
R.EIRP AS RX_EIRP,
ST.LONGITUDE,
ST.LATITUDE,
SR.LONGITUDE,
SR.LATITUDE
FROM DEVICE_DETAILS T
INNER JOIN DEVICE_DETAILS R ON (T.EFL_SYSTEM=R.EFL_SYSTEM) AND (T.FREQUENCY=R.FREQUENCY) AND (T.DEVICE_TYPE != R.DEVICE_TYPE)
INNER JOIN SITE ST ON T.SITE_ID = ST.SITE_ID
INNER JOIN SITE SR ON R.SITE_ID = SR.SITE_ID
WHERE T.FREQUENCY > 7425000000 AND T.FREQUENCY < 7525000000 AND R.FREQUENCY > 7425000000 AND R.FREQUENCY < 7525000000 AND T.DEVICE_TYPE = 'T';
这些是表格:
CREATE TABLE `SITE` (
`SITE_ID` VARCHAR(31) NOT NULL,
`LATITUDE` DECIMAL(18,14) NOT NULL,
`LONGITUDE` DECIMAL(18,14) NOT NULL,
`NAME` VARCHAR(1023) NOT NULL,
`STATE` VARCHAR(80) NOT NULL,
`LICENSING_AREA_ID` INT(3) NOT NULL,
`POSTCODE` VARCHAR(18) NOT NULL,
`SITE_PRECISION` VARCHAR(31) NOT NULL,
`ELEVATION` INT(5) NOT NULL
)
COLLATE='latin1_swedish_ci'
ENGINE=InnoDB
;
对于DEVICE_DETAILS表;缺少一些领域,但这些是基本的。没有主键可能是因为我每天早上都进行CSV批量导入。我想我必须在稍后阶段优化这部分
+--------------------------------+----------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra|
+--------------------------------+----------------+------+-----+---------+-------+
| SDD_ID | int(10) | NO | | NULL ||
| FREQUENCY | bigint(20) | NO | | NULL ||
| BANDWIDTH | int(15) | NO | | NULL ||
| CARRIER_FREQ | bigint(20) | NO | | NULL ||
| EMISSION | varchar(63) | NO | | NULL ||
| DEVICE_TYPE | varchar(1) | NO | | NULL ||
| TRANSMITTER_POWER | int(20) | NO | | NULL ||
| SITE_ID | varchar(31) | NO | | NULL |||
| EFL_SYSTEM | varchar(63) | NO | | NULL ||
+--------------------------------+----------------+------+-----+---------+-------+
在这方面有任何意见或评论。
问题:
1-这些多个INNER JOINS是否良好实践?还有哪些其他选择可以优化它 2-我从CSV使用INFILE输入(每天);我无法使用源格式。我还可以添加索引吗?它会影响进口吗?还有什么需要优化索引方法吗? 3-我可以通过指定长/拉矩形边界在SITE表上添加过滤器 - 这有助于优化操作吗?我应该在哪里添加这些条件
注意:我的SITE表约为11.5MB,DEVICE_DETAILS约为232.8 MB。我有8GB的RAM和8个线程处理器。
答案 0 :(得分:0)
您可以通过在表格中添加INDEXES来进行优化。
在此处阅读更多内容:http://dev.mysql.com/doc/refman/5.7/en/mysql-indexes.html
在我的头顶,没有看到你的数据(这是非常重要的),我建议为主要的WHERE和JOIN子句添加索引:
foo
另外,我认为你可能有一个错误(不是为了优化) - 如果JOIN到ST有这个ON子句:
ALTER TABLE DEVICE_DETAILS ADD INDEX FREQUENCY (FREQUENCY), ADD INDEX DEVICE_TYPE (DEVICE_TYPE), ADD INDEX SITE_ID (SITE_ID);
ALTER TABLE SITE ADD INDEX SITE_ID (SITE_ID);
而不是:
ON T.SITE_ID = ST.SITE_ID