我们希望在我们的购物网站中存储两个或多个产品之间的比较数据。
我找到了以下链接,但是当我们尝试时,我们遇到了一些性能问题
SQL Group By / Count: Count Same Values Across Multiple Columns?
我们如何存储数据?我们的表格架构应该用于比较历史数据,我该如何展示比较最多的产品?什么是查询?
答案 0 :(得分:0)
这个问题相当宽泛,有点模糊,我的答案可能包含你已经考虑过的因素。
为了做比较逻辑,你需要三件事;产品,该产品的评级和一些逻辑分组产品的方法进行比较。具有适当指数的粒度通常是最好的。
以下是我要创建的表/索引的示例:
Create Table Product (ProductID Int, ProductName Varchar(256), etc)
Create Table Groups (GroupID Int, GroupName Varchar(256), etc)
Create Table ProductGroup (ProductID Int, GroupID Int)
Create Table RatingType (RatingID Int, RatingName Varchar(64))
Create Table ProductRatings (ProductID Int, RatingID Int, RatingValue Varchar(32))
Create Clustered Index ix_Product_pID On Product (ProductID)
Create Nonclustered Index ix_Product_pID_pName On Product (ProductID, ProductName)
Create Clustered Index ix_Groups_gID On Groups (GroupID)
Create Nonclustered Index ix_ProductGroup_gID_pID On ProductGroup (GroupID, ProductID)
Create Clustered Index ix_RatingType_rID On RatingType (RatingID)
Create Nonclustered Index ix_ProductRatings_pID_rID On ProductRatings (ProductID, RatingID)
将Clustered Indexes放在Product,Group和RatingType上是有意义的,因为它们的ID列将是它们的标识列,因此您不必担心物理排序,因为它们将是顺序的。另一方面,ProductGroup和ProductRating可以随时以任何顺序接收任何记录,因此将聚簇索引放在它们上会减慢插入速度并导致更快的碎片。
要在链接示例中执行查询中完成的逻辑,您可以执行以下操作:
Create Proc GetProductComparisonRatings (@productID Int, @ratingID Int)
As
Declare @columns Nvarchar(Max),
@SQL Nvarchar(Max);
;With DistinctCols As
(
Select Distinct p.productName
From ProductGroup pg1
Join ProductGroup pg2
On pg1.groupID = pg2.groupID
Join Product p
On pg2.productID = p.productID
Where pg1.productID = @productID
)
Select @columns = Coalesce(@columns + ',','') + '[' + productName + ']'
From DistinctCols
Order By Case
When p.productID = @productID Then 0
Else 1
End; -- This will put your product that was the basis of the comparison as the leftmost column
Select @SQL = ';With baseRecords As
(
Select pg2.productID,
pr.ratingValue,
Count(1) As cnt
From ProductGroup pg1
Join ProductGroup pg2
On pg1.groupID = pg2.groupID
Join ProductRatings pr
On pg2.productID = pr.productID
And pr.ratingID = ' + @ratingID + '
Where pg1.productID = ' + @productID + '
Group By pg2.productID,
pr.ratingValue;
)
Select ratingValue, ' + @columns + '
From baseRecords br
Join product p
On br.productID = p.productID
Pivot (Sum(cnt) For p.productName In (' + @columns + ')) pivot';
Exec sp_executeSQL @SQL;
这使得它更进一步,并将评级比较限制为特定的ratingType;一些例子可能是(耐久性,大小,整体)。如果你只有一个ratingType它仍然可以正常工作。您可以根据需要编辑或更改它。