使用表达式树通过单个属性比较对象网络InvalidOperationException

时间:2015-12-22 22:44:04

标签: c# expression-trees

我正在尝试使用表达式树,因为基于描述,这似乎是最正确(高性能,可配置)的方法。

我希望能够创建一个语句,该语句从existingItems集合中获取与incomingItem的propertyNameToCompareOn值匹配的第一项。

我有一个带有以下签名和模拟代码体的方法......

DetectDifferences<T>(List<T> incomingItems, List<T> existingItems)
{
  var propertyNameToCompareOn = GetThisValueFromAConfigFile(T.FullName());

  //does this belong outside of the loop?
  var leftParam = Expression.Parameter(typeof(T), "left");
  var leftProperty = Expression.Property(leftParam, identField);
  var rightParam = Expression.Parameter(typeof(T), "right");
  var rightProperty = Expression.Property(rightParam, identField);
  //this throws the error
  var condition = Expression.Lambda<Func<T, bool>>(Expression.Equal(leftProperty, rightProperty));

  foreach (var incomingItem in incomingItems) //could be a parallel or something else. 
  {
     // also, where am I supposed to provide incomingItem to this statement?
     var existingItem = existingItems.FirstOrDefault(expression/condition/idk);

     // the statement for Foo would be something like
     var existingFoos = exsistingItems.FirstOrDefault(f => f.Bar.Equals(incomingItem.Bar);

     //if item does not exist, consider it new for persistence
     //if item does exist, compare a configured list of the remaining properties between the 
     // objects. If they are all the same, report no changes. If any
     // important property is different, capture the differences for 
     // persistence. (This is where precalculating hashes seems like the 
     // wrong approach due to expense.)
  }
}

在上面标记的行中,我得到“为lambda声明提供的参数数量不正确”InvalidOperationException。在这一点上,我只是在网上乱砍垃圾,我真的不知道这是什么。 VS可以填满我的屏幕上的一堆重载,并且没有一个例子从MSDN / SO上的文章中有意义。

PS - 我真的不想要一个IComparer或类似的实现,如果它可以帮助。我可以用反思做到这一点。我确实需要尽快做到这一点,但允许它被调用多种类型,因此选择表达式树。

2 个答案:

答案 0 :(得分:3)

使用表达式树时,首先要了解您想要做的事情,这一点非常重要。

我总是首先写出(在静态代码中)使用真正的C#lambda语法得到的表达式。

根据您的描述,您声明的目标是您应该能够(动态)查找某些类型T的属性,以便进行某种快速比较。如果在编译时同时知道TTProperty,你会怎么写呢? 我怀疑它看起来像这样:

Func<Foo, Foo, bool> comparer = (Foo first, Foo second) => 
    first.FooProperty == second.FooProperty;

我们可以立即看到你的Expression错了。你不需要一个输入T,你需要两个!

为什么你也可以获得InvalidOperationException也很明显。您从未向lambda表达式提供任何参数,仅提供正文。以上,&#39;首先&#39;和第二个&#39;是提供给lambda的参数。您还需要将其提供给Expression.Lambda()来电。

var condition = Expression.Lambda<Func<T,T, bool>>(
    Expression.Equal(leftProperty, rightProperty),
    leftParam,
    rightParam);

这只是对Expression.Lambda使用Expression.Lambda(Expression, ParameterExpression[])重载。每个ParameterExpression是正文中使用的参数。就是这样。如果您想要实际调用它,请不要忘记将.Compile()表达式转换为委托。

当然,这并不意味着你的技术必然会很快。如果您使用花哨的表达式树来比较两个列表并采用天真的O(n ^ 2)方法,那么它就不会有用。

答案 1 :(得分:1)

这是一个制作属性访问表达式的方法;

    public static Expression<Func<T, object>> MakeLambda<T>(string propertyName)
    {
        var param = Expression.Parameter(typeof(T));
        var propertyInfo = typeof(T).GetProperty(propertyName);
        var expr = Expression.MakeMemberAccess(param, propertyInfo);
        var lambda = Expression.Lambda<Func<T, object>>(expr, param);
        return lambda;
    } 

你可以像这样使用;

 var accessor = MakeLambda<Foo>("Name").Compile();
 accessor(myFooInstance); // returns name

制作缺失的行

 var existingItem = existingItems.FirstOrDefault(e => accessor(e) == accessor(incomingItem));

请注意==仅适用于像int这样的值类型;小心比较对象。

这里证明lambda方法要快得多;

    static void Main(string[] args)
    {
        var l1 = new List<Foo> { };
        for(var i = 0; i < 10000000; i++)
        {
            l1.Add(new Foo { Name = "x" + i.ToString() });
        }

        var propertyName = nameof(Foo.Name);
        var lambda = MakeLambda<Foo>(propertyName);
        var f = lambda.Compile();

        var propertyInfo = typeof(Foo).GetProperty(nameof(Foo.Name));

        var sw1 = Stopwatch.StartNew();
        foreach (var item in l1)
        {
            var value = f(item);
        }
        sw1.Stop();


        var sw2 = Stopwatch.StartNew();
        foreach (var item in l1)
        {
            var value = propertyInfo.GetValue(item);
        }
        sw2.Stop();

        Console.WriteLine($"{sw1.ElapsedMilliseconds} vs {sw2.ElapsedMilliseconds}");



    }

正如有人也指出的那样,OP中的双循环是O(N ^ 2),如果效率是这里的驱动因素,这应该是下一个考虑因素。