使用表达式树创建DistinctBy

时间:2016-05-28 22:36:54

标签: c# linq expression-trees

我想创建一个扩展IQueryable的方法,用户可以在字符串中指定一个属性名称,通过该属性名称可以区分集合。我想使用HashSet的逻辑。 我基本上想模仿这段代码:

HashSet<TResult> set = new HashSet<TResult>();

foreach(var item in source)
{
    var selectedValue = selector(item);

    if (set.Add(selectedValue))
        yield return item;
}

使用表达式树。

这是我到目前为止的地方:

private Expression AssembleDistinctBlockExpression (IQueryable queryable, string propertyName)
    {
        var propInfo = queryable.ElementType.GetProperty(propertyName);
        if ( propInfo == null )
            throw new ArgumentException();

        var loopVar = Expression.Parameter(queryable.ElementType, "");
        var selectedValue = Expression.Variable(propInfo.PropertyType, "selectedValue");

        var returnListType = typeof(List<>).MakeGenericType(queryable.ElementType);
        var returnListVar = Expression.Variable(returnListType, "return");
        var returnListAssign = Expression.Assign(returnListVar, Expression.Constant(Activator.CreateInstance(typeof(List<>).MakeGenericType(queryable.ElementType))));
        var hashSetType = typeof(HashSet<>).MakeGenericType(propInfo.PropertyType);
        var hashSetVar = Expression.Variable(hashSetType, "set");
        var hashSetAssign = Expression.Assign(hashSetVar, Expression.Constant(Activator.CreateInstance(typeof(HashSet<>).MakeGenericType(propInfo.PropertyType))));

        var enumeratorVar = Expression.Variable(typeof(IEnumerator<>).MakeGenericType(queryable.ElementType), "enumerator");
        var getEnumeratorCall = Expression.Call(queryable.Expression, queryable.GetType().GetTypeInfo().GetDeclaredMethod("GetEnumerator"));
        var enumeratorAssign = Expression.Assign(enumeratorVar, getEnumeratorCall);

        var moveNextCall = Expression.Call(enumeratorVar, typeof(IEnumerator).GetMethod("MoveNext"));

        var breakLabel = Expression.Label("loopBreak");

        var loopBlock = Expression.Block(
            new [] { enumeratorVar, hashSetVar, returnListVar },
            enumeratorAssign,
            returnListAssign,
            hashSetAssign,
            Expression.TryFinally(
                Expression.Block(
                    Expression.Loop(
                        Expression.IfThenElse(
                        Expression.Equal(moveNextCall, Expression.Constant(true)),
                        Expression.Block(
                            new[] { loopVar },
                            Expression.Assign(loopVar, Expression.Property(enumeratorVar, "Current")),
                            Expression.Assign(selectedValue, Expression.MakeMemberAccess(loopVar, propInfo)),
                            Expression.IfThen(
                                Expression.Call(typeof(HashSet<>), "Add", new Type[] { propInfo.PropertyType }, hashSetVar, selectedValue),
                                Expression.Call(typeof(List<>), "Add", new Type[] { queryable.ElementType }, returnListVar, loopVar)
                                )
                            ),
                        Expression.Break(breakLabel)
                        ),
                    breakLabel
                    ),
                    Expression.Return(breakLabel, returnListVar)
                ),
                Expression.Block(
                    Expression.Call(enumeratorVar, typeof(IDisposable).GetMethod("Dispose"))
                )
            )
        );
        return loopBlock;
    }

为变量Expression.Block调用loopBlock时出现异常,如下所示:

  

类型'System.Collections.Generic.HashSet`1 [T]'上没有方法'添加'。

1 个答案:

答案 0 :(得分:5)

您使用的Expression.Call method overload用于静态方法。

引自上述参考文献:

  

创建一个MethodCallExpression,它通过调用相应的工厂方法来表示对静态(Visual Basic中的Shared)方法的调用。

您需要做的是使用an overload of that method that is for calling instance methods

以下是代码的相关部分的外观:

Expression.IfThen(
    Expression.Call(hashSetVar, "Add", new Type[] { }, selectedValue),
    Expression.Call(returnListVar, "Add", new Type[] { }, loopVar))

注意我们现在如何传递我们需要在Expression.Call的第一个参数中调用的实例(表达式)。

请注意我们传递一个空类型参数列表。原因是此类中的Add方法没有任何类型参数。 THashSet<T>中的类型参数List<T>是在类级别定义的,而不是在方法级别定义的。

只有在方法本身上定义类型参数时才需要指定类型参数:

void SomeMethod<T1>(...