我在mysql-workbench
上使用Ubuntu 18.04.
6.3
我创建了三个表,如下所示:
CREATE TABLE `prefix_random` (
`domain` varchar(500) NOT NULL,
PRIMARY KEY (`domain`),
UNIQUE KEY `domain_UNIQUE` (`domain`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
注意:这里还有32个字段,但是为了简洁起见,我不对其进行查询。
示例:
domain
-----------------
sub.example.net
第二张表:
CREATE TABLE `noprefix_random` (
`domain` varchar(500) NOT NULL,
PRIMARY KEY (`domain`),
UNIQUE KEY `domain_UNIQUE` (`domain`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
注意:这里还有32个字段,但是为了简洁起见,我不对其进行查询。
示例:
domain
----------------------
example.net
第三张桌子:
CREATE TABLE `new_random` (
`new_domain` varchar(500) NOT NULL,
PRIMARY KEY (`new_domain`),
UNIQUE KEY `new_domain_UNIQUE` (`new_domain`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
注意:还有3个字段,但我不对其进行查询,为简洁起见,省略了它们。
示例:
new_domain
------------------------
http://sub.example.com
我要进行如下查询以在三个表中标识共享名example.com
:
查询:
SELECT `new_random`.`new_domain`,`prefix_random`.`domain`,`noprefix_random`.`domain`
FROM `myscheme`.`new_random`
JOIN `myscheme`.`prefix_random`
# the substring to extract the part: sub.example.com
ON substring_index(`new_random`.`new_domain`,'http://',-1) = `prefix_random`.`domain`
JOIN `myscheme`.`noprefix_random`
# by adding sub, it becomes: sub.example
ON CONCAT('sub.',`noprefix_random`.`domain`) = `new_domain`,`prefix_random`;
预期输出为:
http://sub.example.com, sub.example.com, example.com
查询将永远持续下去。如果我使用L将输出限制为小数
LIMIT 10;
我得到结果。记录数不能太大。 prefix_random
包含620062,noprefix_random
包含,62294和588380记录。
出什么问题了?您能帮我运行查询吗?
答案 0 :(得分:0)
处理域的最佳方法是使用对域具有generated columns功能的reverse并为此生成的列编制索引。这样,大量查询可以WHERE domain LIKE CONCAT(reverse(const),'%')
并使用索引。
在查询中删除http://
也是一种昂贵的方法。也可以在生成的函数/索引中使用它。
CREATE TABLE `new_random` (
`new_domain` varchar(500) NOT NULL,
PRIMARY KEY (`new_domain`))
INSERT INTO new_random VALUES ('http://a.b.c'),('http://d.e.f')
ALTER TABLE new_random ADD no_https VARCHAR(500) AS (substring_index(`new_domain`,'http://',-1)), ADD KEY(no_https)
ALTER TABLE new_random ADD rev_domain VARCHAR(500) AS (REVERSE(no_https)), ADD KEY(rev_domain)
SELECT * FROM new_random
new_domain | no_https | rev_domain :----------- | :------- | :--------- http://a.b.c | a.b.c | c.b.a http://d.e.f | d.e.f | f.e.d
EXPLAIN SELECT new_domain FROM new_random WHERE rev_domain LIKE 'c.b.%'
id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra -: | :---------- | :--------- | :--------- | :---- | :------------ | :--------- | :------ | :--- | ---: | -------: | :----------------------- 1 | SIMPLE | new_random | null | range | rev_domain | rev_domain | 2003 | null | 1 | 100.00 | Using where; Using index
db <>提琴here