如何强制Entity Framework生成更高效的SQL代码?

时间:2015-05-15 13:36:33

标签: c# sql linq entity-framework optimization

我们正在使用EF 6.1。尽管v4有所改进,但经常需要帮助EF决定如何更有效地生成SQL。通常有助于在我们的案例中使用LINQ并指定连接。

然而,现在我有一个案例,我不知道该怎么做(除了彻底规避EF):

return db.Testlets.Include("TestTasks.TestQuestions.TestAnswers")
         .Include("TestTasks.TestQuestions.TestQuestionCriterionGroups.TestQuestionCriterions")
         .Include("TestTasks.TestQuestions.Question.Answers")
         .Where(x => x.TestId == testId && x.ShownOn.HasValue)
         .ToList();

这会产生非常低效的代码。事实上,如果EF产生这样的东西,它应该足够和最好:

SELECT * 
FROM TestLet TL
INNER JOIN TestTask TT ON TL.Guid = TT.TestletId
INNER JOIN TestQuestion TQ ON TT.Guid = TQ.TestTaskId
INNER JOIN TestAnswer TA ON TQ.Guid = TA.TestQuestionId
LEFT OUTER JOIN TestQuestionCriterionGroup TQCG ON TQCG.TestQuestionId = TQ.Guid
LEFT OUTER JOIN TestQuestionCriterion TQC ON TQCG.Guid = TQC.TestQuestionCriterionGroupId
INNER JOIN Question Q ON TQ.QuestionId = Q.QuestionId AND Q.IsActive = 1
INNER JOIN Answer A ON Q.QuestionId = A.QuestionId AND A.IsActive = 1
WHERE 
    TL.TestId='59ADFB3F-16A6-46E0-8054-7F6E83414DC9'
    AND TL.ShownOn IS NOT NULL

我发现下面的代码(最后没有包含)产生了上面的SQL,但是只选择了testlets列(没有应用包含,因为它们不存在,因此没有映射到EF实体)我需要整个层次结构急切地加载。当我最后添加包含时,生成的SQL又变得非常糟糕且非常慢:

                (from tl in
                db.Testlets.Where(tl => tl.TestId == testId && tl.ShownOn.HasValue)
                from tt in db.TestTasks.Where(tt => tl.Guid == tt.TestletId)
                from tq in db.TestQuestions.Where(tq => tt.Guid == tq.TestTaskId)
                from ta in db.TestAnswers.Where(ta => tq.Guid == ta.TestQuestionId)
                from q in db.Questions.Where(q => tq.QuestionId == q.Id)
                from a in db.Answers.Where(a => q.Id == a.QuestionId)
                from tqcg in
                    db.TestQuestionCriterionGroups.Where(tqcg => tq.Guid == tqcg.TestQuestionId).DefaultIfEmpty()
                from tqc in
                    db.TestQuestionCriterions.Where(tqc => tqcg.Guid == tqc.TestQuestionCriterionGroupId)
                        .DefaultIfEmpty()
                select tl).Include("TestTasks.TestQuestions.TestAnswers")
                .Include("TestTasks.TestQuestions.TestQuestionCriterionGroups.TestQuestionCriterions")
                .Include("TestTasks.TestQuestions.Question.Answers") 

有没有人知道如何编写linq2sql o entities2sql代码哪个有效且结果正确?或者只有在这种更复杂的情况下放弃EF的方法呢?如果是这样,如何以最简单的方式映射回EF结构(来自SQL以及上面的连接)?

如果有人想了解更多关于如何进行左连接的信息:https://msdn.microsoft.com/en-us/library/bb397895.aspx

以及为什么包含在开头的查询中指定时不起作用: http://blogs.msdn.com/b/alexj/archive/2009/06/02/tip-22-how-to-make-include-really-include.aspx

更新:生成的sql:https://gist.github.com/Ondrashx/d0347fc807f0f7fbdf46

的要点

1 个答案:

答案 0 :(得分:1)

将查询分成两部分。将Testlet,TestTasks,TestQuestions,TestAnswers加载到1中,剩余的加载到秒中 - 假设ObjectContexts具有像DbContext那样的自动混合:

类似的东西:

var results=db.Testlets.Include("TestTasks.TestQuestions.TestAnswers")
    .Where(x => x.TestId == testId && x.ShownOn.HasValue)
    .ToList();

然后加载孩子:

var questionIds=results.TestQuestions.Select(tq=>tq.Guid).ToArray();

db.TestQuestions
    .Include("TestQuestionCriterionGroups.TestQuestionCriterions")
    .Include("TestTasks.TestQuestions.Question.Answers")
    .Where(tq=>questionIds.Contains(tq.Guid))
    .Load();

我从未使用过ObjectContext,但是DbContext会加载子进程,并在第一个查询中自动修复代理,以便全部填充。 (或者应该 - 我做类似的事情,但加载整个表格,而不仅仅是选择部分。)

如果您的性能问题是由结果集变得太大而需要传输然后丢弃冗余列数据引起的,那么这应该可行。当然,如果需要,您可以在2个以上的查询中中断查询,但是您需要在传输/处理较少的冗余列以及更多往返数据库的过程中平衡性能改进。

你也可以尝试这样的事情(我自己从未做过,但看起来很有希望......不确定它是否会加载孩子们)

var conn=new SqlConnection("{Your sqlconnection string}");
conn.Open();
var cmd=new SqlCommand("{Your query}",conn);
var dr=cmd.ExecuteReader();
var result=db.Translate<Testlets>(dr);