Question

我有一个带有字段name的mysql表，其中可能包含如下所示的常用条目

name
---
abc
abc.com

我想选择所有常用值，并且我已经编写了以下查询：

select * from table
group by name having count(*) >= 2;

这里，name基本上是服务器主机名。因此，根据定义，我只需比较.之前的第一个值因此，server与server.abc.com相同我选择的0行看起来不正确

Answer 1

对于您的RDMS，这些不是重复值。数据库正在比较匹配的字符串和'abc' != 'abc.com'。我认为你想要的是检查多个网址，无论顶级域名（.com，.org等）如何。为此，我们可以在最后一段时间之前获取URL。

select 
  substr(
    name
    , 0
    , locate('.', reverse(name))
  )
  , count(*) 
from 
  table
group by 
  substr(
    name
    , 0
    , locate('.', reverse(name))
  ) 
having count(*) >= 2;

上述代码会忽略该域名，但您可能仍会遇到子域名（news.abc.com，videos.abc.com等）或协议指标（http，https，等等）。如果你需要，我会把这些作为练习留给你。

Answer 2

据我所知，我创建一个查询可能会对你有所帮助由于您没有显示正确的数据库结构，因此我在表中创建了相同的方案并按照该方式创建了查询例如：

从city c1 inner join city c2中选择count（c1.city_name）作为总计在c1.city_name上LIKE CONCAT（'％'，c2.city_name，'％'）分组依据总计> 1的c1.city_id;

Answer 3

尝试这样的事情，这项工作适用于oracle

select * from(
SELECT a.name, count(b.id) duplicates  FROM  table a,table b 
WHERE a.name LIKE CONCAT(b.name, '%')
group by a.name
) where duplicates >=2

Answer 4

select name, count(name) 
  from (select substring(name, 1, 
               if(position("." in name)=0,
                 length(name),
                 position("." in name)-1) 
               ) name
         from table) t1
  group by name 
  having count(name) >= 2;

如果您想要所有参赛作品，请删除＆＃34;有计数（姓名）＆gt; = 2＆＃34;

MYSQL在name列上查找公共值

4 个答案: