linq - 如何查询一个查询源中不在另一个查询源中的项?

时间:2008-09-08 21:10:50

标签: c# .net linq .net-3.5

如果我有2个查询源,如何找到一个不在另一个中的查询源?

在两者中查找项目的连接示例:

var results = from item1 in qs1.Items
   join item2 in qs2 on item1.field1 equals item2.field2
   select item1;

那么linq代码将返回qs1中不在qs2中的项目是什么?

5 个答案:

答案 0 :(得分:4)

来自Marco Russo

NorthwindDataContext dc = new NorthwindDataContext();
dc.Log = Console.Out;
var query =
    from c in dc.Customers
    where !(from o in dc.Orders
            select o.CustomerID)
           .Contains(c.CustomerID)
    select c;
foreach (var c in query) Console.WriteLine( c );

答案 1 :(得分:4)

使用Except扩展方法。

var items1 = new List<string> { "Apple","Orange","Banana" };
var items2 = new List<string> { "Grapes","Apple","Kiwi" };

var excluded = items1.Except(items2);

答案 2 :(得分:3)

达伦科普的answer

var excluded = items1.Except(items2);
从性能角度来看,

是最佳解决方案。

(注意:对于至少常规的LINQ,也许LINQ to SQL根据Marco Russo's blog post更改内容。但是,我想在“最坏的情况下”Darren Kopp的方法将返回至少在RussQ方法的速度,即使在LINQ to SQL环境中也是如此。

作为一个简单的示例,请在LINQPad中尝试:

void Main()
{
   Random rand = new Random();
   int n = 100000;
   var randomSeq = Enumerable.Repeat(0, n).Select(i => rand.Next());
   var randomFilter = Enumerable.Repeat(0, n).Select(i => rand.Next());

   /* Method 1: Bramha Ghosh's/Marco Russo's method */
   (from el1 in randomSeq where !(from el2 in randomFilter select el2).Contains(el1) select el1).Dump("Result");

   /* Method 2: Darren Kopp's method */
   randomSeq.Except(randomFilter).Dump("Result");
}

尝试一次评论两种方法中的一种,并尝试不同n值的性能。

我的经验(在我的Core 2 Duo笔记本电脑上)似乎暗示:

n = 100. Method 1 takes about 0.05 seconds, Method 2 takes about 0.05 seconds
n = 1,000. Method 1 takes about 0.6 seconds, Method 2 takes about 0.4 seconds
n = 10,000. Method 1 takes about 2.5 seconds, Method 2 takes about 0.425 seconds
n = 100,000. Method 1 takes about 20 seconds, Method 2 takes about 0.45 seconds
n = 1,000,000. Method 1 takes about 3 minutes 25 seconds, Method 2 takes about 1.3 seconds

方法2(Darren Kopp的回答)显然更快。

对于较大的n,方法2的速度降低很可能是由于随机数据的创建(随意放入DateTime差异来确认这一点),而方法1显然存在算法复杂性问题(并且只是看着你可以看到它与第一个集合中的每个数字至少为O(N ^ 2),它与整个第二个集合进行比较)。

结论:使用Darren Kopp对LINQ“除外”方法的回答

答案 3 :(得分:1)

另一种完全不同的方式是将lambda表达式(用于填充第二个集合的条件)作为谓词传递给第一个集合。

我知道这不是问题的确切答案。我认为其他用户已经给出了正确答案。

答案 4 :(得分:0)

这是同一件事的更简单版本,您不需要嵌套查询:

List<string> items1 = new List<string>();
items1.Add("cake");
items1.Add("cookie");
items1.Add("pizza");

List<string> items2 = new List<string>();
items2.Add("pasta");
items2.Add("pizza");

var results = from item in items1
          where items2.Contains(item)
          select item;

foreach (var item in results)
    Console.WriteLine(item); //Prints 'pizza'