产品比较数据库架构

时间:2013-01-08 16:24:02

标签: sql database-design database-schema database-performance

我们希望在我们的购物网站中存储两个或多个产品之间的比较数据。

我找到了以下链接,但是当我们尝试时,我们遇到了一些性能问题

SQL Group By / Count: Count Same Values Across Multiple Columns?

我们如何存储数据?我们的表格架构应该用于比较历史数据,我该如何展示比较最多的产品?什么是查询?

1 个答案:

答案 0 :(得分:0)

这个问题相当宽泛,有点模糊,我的答案可能包含你已经考虑过的因素。

为了做比较逻辑,你需要三件事;产品,该产品的评级和一些逻辑分组产品的方法进行比较。具有适当指数的粒度通常是最好的。

以下是我要创建的表/索引的示例:

Create  Table Product (ProductID Int, ProductName Varchar(256), etc)
Create  Table Groups (GroupID Int, GroupName Varchar(256), etc)
Create  Table ProductGroup (ProductID Int, GroupID Int)
Create  Table RatingType (RatingID Int, RatingName Varchar(64))
Create  Table ProductRatings (ProductID Int, RatingID Int, RatingValue Varchar(32))

Create  Clustered Index ix_Product_pID On Product (ProductID)
Create  Nonclustered Index ix_Product_pID_pName On Product (ProductID, ProductName)
Create  Clustered Index ix_Groups_gID On Groups (GroupID)
Create  Nonclustered Index ix_ProductGroup_gID_pID On ProductGroup (GroupID, ProductID)
Create  Clustered Index ix_RatingType_rID On RatingType (RatingID)
Create  Nonclustered Index ix_ProductRatings_pID_rID On ProductRatings (ProductID, RatingID)

将Clustered Indexes放在Product,Group和RatingType上是有意义的,因为它们的ID列将是它们的标识列,因此您不必担心物理排序,因为它们将是顺序的。另一方面,ProductGroup和ProductRating可以随时以任何顺序接收任何记录,因此将聚簇索引放在它们上会减慢插入速度并导致更快的碎片。

要在链接示例中执行查询中完成的逻辑,您可以执行以下操作:

Create  Proc GetProductComparisonRatings (@productID Int, @ratingID Int)
As

Declare @columns Nvarchar(Max), 
        @SQL Nvarchar(Max);

;With   DistinctCols As
(
        Select  Distinct p.productName
        From    ProductGroup pg1
        Join    ProductGroup pg2
                On  pg1.groupID = pg2.groupID
        Join    Product p
                On  pg2.productID = p.productID
        Where   pg1.productID = @productID      
)
Select  @columns = Coalesce(@columns + ',','') + '[' + productName + ']'
From    DistinctCols
Order   By  Case
            When    p.productID = @productID Then 0
            Else    1
            End;        -- This will put your product that was the basis of the comparison as the leftmost column

Select  @SQL = ';With   baseRecords As
                (
                        Select  pg2.productID, 
                                pr.ratingValue, 
                                Count(1) As cnt
                        From    ProductGroup pg1
                        Join    ProductGroup pg2
                                On  pg1.groupID = pg2.groupID
                        Join    ProductRatings pr
                                On  pg2.productID = pr.productID
                                And pr.ratingID = ' + @ratingID + '
                        Where   pg1.productID = ' + @productID + '
                        Group   By  pg2.productID, 
                                    pr.ratingValue;
                )
                Select  ratingValue, ' + @columns + '
                From    baseRecords br
                Join    product p
                        On  br.productID = p.productID
                Pivot   (Sum(cnt) For p.productName In (' + @columns + ')) pivot';

Exec    sp_executeSQL @SQL;

这使得它更进一步,并将评级比较限制为特定的ratingType;一些例子可能是(耐久性,大小,整体)。如果你只有一个ratingType它仍然可以正常工作。您可以根据需要编辑或更改它。