我搜索了Find duplicate entries in a column和Oracle: find duplicate rows in select query,但似乎无法得到任何答案......
我有一些看起来像这样的数据
columnA columnB columnC
1111111 emailID1 true
1111111 emailID2 false
1111222 emailID3 true
1111339 emailID4 true
2384398 emailID5 true
我想只显示这些列在columnA中具有相同值但在columnB和/或C中可能不同的列:
columnA columnB columnC
1111111 emailID1 true
1111111 emailID2 false
使用有> 1似乎并没有抓住这个,任何想法? 感谢。
答案 0 :(得分:7)
使用having count(*) > 1
只是谜题的一半。另一半是得到相应的行。
你可以这样做:
SELECT *
FROM MyTable
WHERE ColumnA IN (
SELECT ColumnA FROM MyTable GROUP BY ColumnA HAVING COUNT(*) > 1
)
答案 1 :(得分:5)
试试这个:
SELECT t.*
FROM (SELECT ColumnA FROM MyTable GROUP BY ColumnA HAVING COUNT(*) > 1) dups
JOIN MyTable t ON t.ColumnA = dups.ColumnA
只要索引在ColumnA
:
create index MyTable_ColumnA on MyTable(ColumnA);
这样的索引将用于主查询和内部查询,为您提供非常好的性能。
答案 2 :(得分:1)
我通常希望避免在查询中多次访问表 - 即使没有索引也能正常工作 - 只对表执行一次扫描:
SELECT columnA, columnB, columnC
FROM (SELECT mytable.*
,COUNT(*) OVER (PARTITION BY columnA) countA
FROM mytable)
WHERE countA > 1
答案 3 :(得分:0)
SELECT T.columnA, S.columnB, S.columnC FROM
(
SELECT columnA FROM someTable
GROUP BY columnA
HAVING COUNT(*) > 1
) T INNER JOIN someTable S ON T.columnA = S.columnA
答案 4 :(得分:0)
您可以使用分析功能执行此操作。找到最小值和最大值并返回它们不同的行:
select columnA, columnB, columnC
from (select t.*, min(t.columnC) over (partition by columnA, columnB) as minC,
max(t.columnC) over (partition by columnA, columnB) as maxC
from t
) t
where minC <> maxC;
答案 5 :(得分:0)
这个帖子可能已经过时但是值得更新每个人更好/更有效的解决方案来查找重复记录。您可以使用分区查找匹配列上的重复记录(根据需要使用多个列而不使用内部联接)。
SELECT *
FROM (
SELECT t.*, ROW_NUMBER() OVER (PARTITION BY column1, column2 ORDER BY your_key_column) AS duplicate_count
FROM yourtable t
)
WHERE duplicate_count > 1 --get duplicate records for the matching value in column1 and column2
见@ here @Quassnoi的原始答案。感谢他,使用分区非常聪明的解决方案。
答案 6 :(得分:0)
如果您要查找数据库中具有唯一ID的条目,其中列中可能出现多个键,那么找到它们的一种简单方法是创建两个表,如下面所示:
此处:TICKETID是主键,TKTNUMBER可以多次出现。
CREATE TABLE TEMP
(
TICKETID FLOAT,
TKTNUMBER FLOAT
);
CREATE TABLE TEMP2
(
TKTNUMBER FLOAT,
COUNTER INTEGER
);
只需使用COUNT(TKTNUMBER)&gt; 1查看TKTNUMBERS,即可输入所有TICKETID和TKTNUMBER:
INSERT INTO TEMP
SELECT
TICKETID,
TKTNUMBER
FROM YOUR_TABLE
WHERE TKTNUMBER IN (
SELECT TKTNUMBER
FROM YOUR_TABLE
HAVING COUNT (TKTNUMBER) > 1
GROUP BY TKTNUMBER);
最后,要查看计数器,请按照与上述相同的方式输入TKTNUMBER和COUNT:
INSERT INTO TEMP2
SELECT
TKTNUMBER,
COUNT (TKTNUMBER) AS COUNTER
FROM YOUR_TABLE
HAVING COUNT (TKTNUMBER) > 1
GROUP BY TKTNUMBER
ORDER BY 2 DESC
您可以选择如下(通过连接tktnumber上的两个表):
SELECT
T1.TICKETID,
T1.TKTNUMBER,
T2.COUNTER
FROM
TEMP T1 INNER JOIN
TEMP2 T2 ON
T2.TKTNUMBER = T1.TKTNUMBER
ORDER BY T2.COUNTER DESC