我有一个带有字段的问题表(QuestionID,QuestionMarks),数据字段看起来像 -
QuestionID QuestionMarks
1 1
2 4
5 1
9 1
12 2
这意味着目前问题表有5个问题共9个标记,现在我的问题是我想知道4个问题与8个标记的组合是可能的并且取出该组合(通常是“ x“有”y“标记的问题是可能的吗?
我当时正在考虑使用CTE,但如果我有数万个问题,我担心执行查询会花费大量时间。
请提出一些如何获取数据的建议。我使用的是SQL Server 2008版
答案 0 :(得分:0)
这是开始。它的表现会很糟糕:
declare @Qs table (QuestionID int not null, QuestionMarks int not null)
insert into @Qs (QuestionID,QuestionMarks) values
(1,1), (2,4), (5,1), (9,1), (12,2)
declare @TargetMarks int = 8
declare @TargetCount int = 4
;with Build as (
select QuestionID as MinID,QuestionID as MaxID,QuestionMarks as Total,1 as Cnt
,'/' + CONVERT(varchar(max),QuestionID) + '/' as QPath
from @Qs
union all
select MinID,q.QuestionID,Total+q.QuestionMarks,Cnt+1,QPath + CONVERT(varchar(max),q.QuestionID) + '/'
from
Build b
inner join
@Qs q
on
b.MaxID < q.QuestionID and
b.Total + q.QuestionMarks <= @TargetMarks and
b.Cnt < @TargetCount
)
select * from Build where Cnt = @TargetCount and Total = @TargetMarks
结果集:
MinID MaxID Total Cnt QPath
--------------------------------------------------------------------------------
2 12 8 4 /2/5/9/12/
1 12 8 4 /1/2/9/12/
1 12 8 4 /1/2/5/12/
棘手的部分是QPath值并不是存储ID值的最佳方式。
答案 1 :(得分:0)
我认为你是对的,成千上万的问题会减慢执行速度,所以我首先要限制被查询的潜在行。您已经确定,即使有数百万行,您也不需要使用相同的QuestionMark超过四个,您可以进一步减少这一点,例如: (很抱歉不知道SQL Server是否接受这种语法)
WITH LimitPotentialRows AS
(SELECT m1.QuestionID, m1.QuestionMarks,
(SELECT SUM(m2.QuestionMarks)
FROM MyTable m2
WHERE m1.QuestionMarks = m2.QuestionMarks
AND m1.PrimaryKeyID <= m2.PrimaryKeyID) CurrentMarks,
(SELECT COUNT(*)
FROM MyTable m3
WHERE m1.QuestionMarks = m3.QuestionMarks
AND m1.PrimaryKeyID <= m3.PrimaryKeyID) TotalQuestions
FROM MyTable m1
WHERE m1.QuestionMarks <= :DesiredTotalQuestionMarks - :TotalNoOfQuestions + 1
HAVING CurrentMarks <= :DesiredTotalQuestionMarks
AND TotalQuestions <= :TotalNoOfQuestions)
想要4个问题共8个分数,这个CTE的结果只会让你只有
QuestionMarks NumberOfQuestions
1 4
2 4
3 2
4 1
5 1
将行数限制在数万到最大12之间,在进一步的计算中不太可能出现性能问题。