如何优化这个linq查询?

时间:2010-09-16 17:21:31

标签: c# .net sql linq optimization

我有以下linq查询:

var allnews = from a in db.News
                              where !(from c in db.NewsViews
                                      where c.UserGuid == thisUser.UserGuid
                                      select c.NewsGuid).Contains(a.NewsGuid)
                              orderby a.Date descending
                              select a;

我想知道优化它的最佳方法是什么?或者查询分析器会为我做那个吗?

编辑:想法是获取用户尚未看到的所有新闻项目。因此,一旦用户看到一个项目,我就将该项目存储在NewsViews中。新闻本身就在新闻中。

6 个答案:

答案 0 :(得分:4)

子查询似乎不使用a,所以

      //untested
      var allnews = from a in db.News
                    let excluders = from c in db.NewsViews
                                    where c.UserGuid == thisUser.UserGuid
                                    select c.NewsGuid   
                          where !excluders.Contains(a.NewsGuid)
                          orderby a.Date descending
                          select a;

但是请注意,您现在正在通过LINQ进行SQL优化(顺便说一下,这是L2S还是EF?)。 而正常的SQL优化很难。您必须使用实际数据进行测量和分析。 @ Joachim的多内连接子查询方法很可能更好。

答案 1 :(得分:2)

而不是使用contains,您可以添加到内部查询的where-statement:

...和c.newsguid == a.newsguid

内部查询的

和.Any()

var allnews = from a in db.News
                  where !(from c in db.NewsViews
                          where c.UserGuid == thisUser.UserGuid
                            and c.NewsGuid == a.NewsGuid).Any()
                   orderby a.Date descending
                   select a;

答案 2 :(得分:1)

我假设目标是按降序日期顺序检索NewsView:

db.News.OrderByDescending(a => a.Date).NewsViews;

当然,这假设您已经在模型中设置了News和NewsViews实体之间的关联。通过提前设置关联,子查询变得不必要。

<强>更新

我一直在使用LINQ-to-SQL大约18个月,而且我一直在使用与你所说明的NOT IN查询相同的结构。正如我之前所说的,如果你提前在模型中设置关联并使用数据库本身的索引,你可能会遇到一点性能提升,但从LINQ的角度来看,我相信你已经像你一样优化了。无需借助不必要的神秘查询语句就可以获得。

答案 3 :(得分:1)

这是另一种选择:

from newsitem in db.News
join viewing in (
       from viewing in db.NewsViews
       where viewing.UserGuid == thisUser.UserGuid
       select viewing
) on newsitem.NewsGuid equals viewing.NewsGuid into usersviewings
where !usersviewings.Any()
orderby newsitem.Date descending
select newsitem;

但至于这是否更快 - 这是任何人的猜测;试试吧。从根本上说,你正在进行左连接,左边的部分被过滤掉了,不能返回任何结果 - 那些索引不好,AFAIK。执行引擎需要扫描新闻集中的所有行,如果您受SQL支持,则表扫描不是您的朋友。话虽如此,除非你真的希望这是一张巨大的牌桌,否则它可能并不重要,特别是如果你只报告前N个命中......

答案 4 :(得分:0)

也许这是我对linq知识的不足,但也许是一个左连接,其中NewsViews中的列为空?这似乎比制作子查询并比较两者更好。

答案 5 :(得分:0)

你可以在这里进行的最佳优化移动,是允许从NewsViews导航到新闻......由于一个不存在,我不得不得到一点点hacky与优化

db.News.Join(db.News.Select(n => n.NewsGuid)
    .Except(db.NewsViews
        .Where(c => c.UserGuid == thisUser.UserGuid)
        .Select(c => c.NewsGuid)
    ), n1 => n1.NewsGuid, n2 => n2, (n1, n2) => new { n1 = n1, n2 = n2 })
    .Select(anon => anon.n1);

当您尝试执行列表中不包含其他列表的查询时,Except将生成执行SQL的最佳。由于没有从NewsView导航到新闻,我们不得不通过内部加入作弊来返回新闻。

另一种可以做到这一点的方法是我的朋友GroupJoin。

db.News
    .GroupJoin(db.NewsViews, n => n.NewsGuid, nv => nv.NewsGuid, (n, nv) => new { News = n, NewsViewList = nv })
    .Where(anon => anon.NewsViewList != null) // I don't remember the best test here, either it's not null, or the count > 0 :-)
    .OrderByDescending(anon => anon.News.Date)
    .Select(anon => anon.News);

至少我会这样做。