我有以下2个表,api_analytics_data和telecordia。
CREATE TABLE `api_analytics_data` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`upload_file_id` bigint(20) NOT NULL,
`partNumber` varchar(100) DEFAULT NULL,
`clei` varchar(45) DEFAULT NULL,
`description` varchar(150) DEFAULT NULL,
`processed` tinyint(1) DEFAULT '0',
PRIMARY KEY (`id`),
KEY `idx_aad_clei` (`clei`),
KEY `idx_aad_pn` (`partNumber`),
KEY `id_aad_processed` (`processed`),
KEY `idx_combo1` (`partNumber`,`clei`,`upload_file_id`)
) ENGINE=InnoDB CHARSET=latin1;
CREATE TABLE `telecordia` (
`tid` int(11) NOT NULL AUTO_INCREMENT,
`ProdID` varchar(50) DEFAULT NULL,
`Mfg` varchar(20) DEFAULT NULL,
`Pn` varchar(50) DEFAULT NULL,
`Clei` varchar(50) DEFAULT NULL,
`Series` varchar(50) DEFAULT NULL,
`Dsc` varchar(50) DEFAULT NULL,
`Eci` varchar(50) DEFAULT NULL,
`AddDate` date DEFAULT NULL,
`ChangeDate` date DEFAULT NULL,
`Cost` float DEFAULT NULL,
PRIMARY KEY (`tid`),
KEY `telecordia.ProdID` (`ProdID`) USING BTREE,
KEY `telecordia.clei` (`Clei`),
KEY `telecordia.pn` (`Pn`),
KEY `telcordia.eci` (`Eci`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1;
用户使用Excel / CSV文件通过Web界面将数据上传到api_analytics_data。数据包含partNumbers或CLEIs。然后我通过加入telecordia表来更新api_analytics_data表。 telecordia表是partNumber和Cleis的主列表。
因此,如果用户上传CLEI文件,我使用的更新/加入是:
update api_analytics_data aad
inner join telecordia t on aad.clei = t.Clei
set aad.partNumber = t.Pn
where aad.partNumber is null
and aad.upload_file_id = 5;
它运作迅速,但不是很彻底。我遇到的问题是上传的CLEI可能只是telecordia表中CLEI的子字符串。
例如,上传的CLEI可能是" 5SC1DX0 "。在telcordia表中,正确的匹配行是:
tid: 184324
ProdID: 472467
Mfg: PLSE
Pn: AUA58-2-REV-E
Clei: 5SC1DX04AA
Series: null
Dsc: DL SGL-PTY POTS CU RT
Eci: 205756
AddDate: 1994-03-18
ChangeDate: 1998-04-13
Cost: null
显然,我的更新在这种情况下不起作用,即使 5SC1DX0 和 5SC1DX04AA 是相同的部分。
我需要的是通配符搜索。但是,当我尝试这个时,它是疯狂的慢。大约4500行上传到api_analytics_data表,它运行大约10分钟,然后失去与服务器的连接。
update api_analytics_data aad
inner join telecordia t on aad.clei like concat(t.Clei,'%')
set aad.partNumber = t.Pn
where aad.partNumber is null
and aad.upload_file_id = 5;
有没有办法对其进行优化以便快速运行?
答案 0 :(得分:2)
正确的答案是" no"。更好的做法是在telecordia
中创建一个新列,其中包含正确的 Clei
值,可用于连接表。在MySQL的最新版本中,它甚至可以是计算列并被索引。
也就是说,如果匹配部分的长度始终相同,您可以做一些事情。如果是这样,试试这个:
update api_analytics_data aad inner join
telecordia t
on t.Clei = left(aad.clei, 7)
set aad.partNumber = t.Pn
where aad.partNumber is null and aad.upload_file_id = 5;
对于此查询,您需要api_analytics_data(upload_fiel_id, partNumber, clei)
和telecordia(clei, pn)
上的索引。