使用TPL进行推测性执行

时间:2013-02-06 01:42:40

标签: c# task-parallel-library plinq

我有一个List<Task<bool>>,我想并行查找第一个完成true结果的任务,而不是等待或观察任何其他尚待处理的任务的异常。

var tasks = new List<Task<bool>>
{ 
    Task.Delay(2000).ContinueWith(x => false), 
    Task.Delay(0).ContinueWith(x => true), 
};

我试图用PLINQ做类似的事情:

var task = tasks.AsParallel().FirstOrDefault(t => t.Result);

并行执行,但一旦找到令人满意的结果就不会返回。因为访问Result属性是阻止的。为了使用PLINQ工作,我必须写下这个令人遗憾的声明:

var cts = new CancellationTokenSource();
var task = tasks.AsParallel()
    .FirstOrDefault(t =>
    {
        try 
        { 
            t.Wait(cts.Token);
            if (t.Result)
            {
                cts.Cancel();
            }

            return t.Result;
        } 
        catch (OperationCanceledException) 
        { 
            return false;
        }
    } );

我已经编写了一个扩展方法,可以在完成任务时生成任务。

public static class Exts
{
    public static IEnumerable<Task<T>> InCompletionOrder<T>(this IEnumerable<Task<T>> source)
    {
        var tasks = source.ToList();
        while (tasks.Any())
        {
            var t = Task.WhenAny(tasks);
            yield return t.Result;
            tasks.Remove(t.Result);
        }
    }
}

// and run like so
var task = tasks.InCompletionOrder().FirstOrDefault(t => t.Result);

但感觉这是一种常见的东西,有更好的方法。建议?

3 个答案:

答案 0 :(得分:3)

也许是这样的?

var tcs = new TaskCompletionSource<Task<bool>>();

foreach (var task in tasks)
{
    task.ContinueWith((t, state) =>
    {
        if (t.Result)
        {
            ((TaskCompletionSource<Task<bool>>)state).TrySetResult(t);
        }
    },
        tcs,
        TaskContinuationOptions.OnlyOnRanToCompletion |
        TaskContinuationOptions.ExecuteSynchronously);
}

var firstTaskToComplete = tcs.Task;

答案 1 :(得分:1)

也许您可以尝试使用Rx.Net库。它实际上非常有利于Linq工作。

在引用Microsoft Rx.Net程序集后,在LinqPad中尝试此代码段。

using System
using System.Linq
using System.Reactive.Concurrency
using System.Reactive.Linq
using System.Reactive.Threading.Tasks
using System.Threading.Tasks

void Main()
{
    var tasks = new List<Task<bool>>
    { 
        Task.Delay(2000).ContinueWith(x => false), 
        Task.Delay(0).ContinueWith(x => true), 
    };

    var observable = (from t in tasks.ToObservable()
                      //Convert task to an observable
                      let o = t.ToObservable()
                      //SelectMany
                      from x in o
                      select x);


    var foo = observable
                .SubscribeOn(Scheduler.Default) //Run the tasks on the threadpool
                .ToList()
                .First();

    Console.WriteLine(foo);
}

答案 2 :(得分:1)

首先,我不明白你为什么要在这里使用PLINQ。枚举Task的列表不应该花费很长时间,所以我认为你不会从并行化中获得任何收益。

现在,要获得已使用Task完成的第一个true,您可以使用the (non-blocking) IsCompleted property

var task = tasks.FirstOrDefault(t => t.IsCompleted && t.Result);

如果您希望得到Task的集合,按照完成后的顺序排列,请查看Stephen Toub的文章Processing tasks as they complete。如果要列出首先返回true的那些,则需要修改该代码。如果您不想修改它,可以使用a version of this approach from Stephen Cleary's AsyncEx library


此外,在您的问题的特定情况下,您可以通过向PLINQ查询添加.WithMergeOptions(ParallelMergeOptions.NotBuffered)来“修复”您的代码。但是这样做仍然大部分时间都无法正常工作并且即使它确实可以浪费很多线程。这是因为PLINQ使用了恒定数量的线程和分区,并且使用Result会在大多数时间阻塞这些线程。