在sql视图中删除重复记录

时间:2012-12-07 22:54:51

标签: sql view duplicates

我有一个查询,它从具有第1列重复记录的表中返回数据,但其他列中可能有不同的值。我只想将第1列中每个值的一条记录带入视图,使用标准来选择正确的记录。

这是查询;

SELECT 
   PrimaryColumn1,
   Column2,
   Column3,
   Date1,
   Date2
FROM
   My_Table

我希望在我根据PrimaryColumn1中的最新日期创建的视图中的Date1中只有不同的值,如果这也是重复的,则在Date2中。

我尝试过以下操作,但无法使其正常工作

SELECT 
   PrimaryColumn1,
   Column2,
   Column3,
   Date1,
   Date2
FROM    
   (SELECT  
        [PrimaryColumn1,
        Column2,
        Column3,
        Date1,
        Date2,
        ROW_NUMBER() OVER(PARTITION BY [Date1] ORDER BY Date2) AS RowNumber
    FROM    
        My_Table)
WHERE   
    RowNumber = 1

非常感谢任何帮助。

在下面的建议之后,最终查询看起来像这样:

SELECT 
    PrimaryColumn1,
    Column2, 
    Column3,
    Date1,
    Date2
FROM    
    (SELECT  
         [PrimaryColumn1,
         Column2,
         Column3,
         Date1,
         Date2,
         ROW_NUMBER() OVER(PARTITION BY PrimaryColumn1
                           ORDER BY Date1 DESC, Date2 DESC) AS RowNumber) data
WHERE 
    RowNumber = 1

3 个答案:

答案 0 :(得分:1)

我认为您的ROW_NUMBER()声明应如下所示:

ROW_NUMBER() OVER(PARTITION BY PrimaryColumn1
                      ORDER BY Date1 DESC, Date2 DESC) AS RowNumber

由于您正在寻找每个PrimaryColumn1值的最新记录,因此这应该按照您的意愿行事(据我所知)。

答案 1 :(得分:1)

CROSS APPLY是做这样事情的好方法。例如,这会为Products表中的每个CategoryID提取一条记录,并显示每个类别中最昂贵产品的产品数据。

这有效地为您提供了一种在连接中使用相关子查询的方法。很酷。

USE Northwind;
GO
--Get a distinct list of CategoryID values
--From the dbo.Products table, and show the
--Product details for the most expensive product
--in each of those categories....
SELECT DISTINCT 
  Prod.CategoryID,
  TopProd.ProductID,
  TopProd.ProductName,
  TopProd.UnitPrice
FROM dbo.Products AS Prod
CROSS APPLY 
(
  --Find the top 1 product in each category by unitprice
  SELECT TOP 1 
    ProductID,
    ProductName,
    UnitPrice
  FROM dbo.Products
  --This is the "correlated" part where 
  --we filter by the outer queries' CategoryID
  WHERE CategoryID = Prod.CategoryID
  --The ORDER BY determines which product
  --you see for each category.  In this
  --case I'll get the most expensive product
  ORDER BY UnitPrice DESC
) AS TopProd;

答案 2 :(得分:0)

SELECT 
   PrimaryColumn1,
   Column2,
   Column3,
   Date1,
   Date2
FROM My_Table
INNER JOIN  
   (SELECT  PrimaryColumn1,
        MAX(Date1) AS max_Date1,
        MAX(Date2) AS max_Date2,
        FROM My_Table
        GROUP BY PrimaryColumn1
    ) AS Maxes
ON Maxes.PrimaryColumn1 = My_Table.PrimaryColumn1
AND Maxes.max_Date1 = My_Table.Date1
AND Maxes.max_Date2 = My_Table.Date2