如何在TPL数据流中重置延迟/拒绝的消息

时间:2019-04-24 10:27:19

标签: c# task-parallel-library pipeline tpl-dataflow

我正在为我的应用程序使用TDF,到目前为止,它运行良好,不幸的是,我偶然发现了一个特定问题,似乎无法使用现有的Dataflow机制直接处理该问题:

我有N个生产者(在这种情况下为BufferBlocks),这些生产者都仅链接到1个(均相同)ActionBlock。此块始终一次处理1个项目,并且只能容纳1个项目。

从生产者到ActionBlock的链接中,我还想添加一个过滤器,但是这里的特殊情况是,过滤器条件可以独立于处理过的项目而改变,并且不得丢弃该项目! 因此,基本上我想处理所有项目,但是处理项目的时间/顺序可以更改。

不幸的是,我了解到,如果某个项目被“拒绝”一次->过滤条件为false,并且如果该项目未传递到另一个块(例如NullTarget),则目标块不会重试相同的项目(并且不会重新评估过滤器。)

public class ConsumeTest
  {
    private readonly BufferBlock<int> m_bufferBlock1;
    private readonly BufferBlock<int> m_bufferBlock2;
    private readonly ActionBlock<int> m_actionBlock;

    public ConsumeTest()
    {
      m_bufferBlock1 = new BufferBlock<int>();
      m_bufferBlock2 = new BufferBlock<int>();

      var options = new ExecutionDataflowBlockOptions() { BoundedCapacity = 1, MaxDegreeOfParallelism = 1 };
      m_actionBlock = new ActionBlock<int>((item) => BlockAction(item), options);

      var start = DateTime.Now;
      var elapsed = TimeSpan.FromMinutes(1);

      m_bufferBlock1.LinkTo(m_actionBlock, x => IsTimeElapsed(start, elapsed));
      m_bufferBlock2.LinkTo(m_actionBlock);

      FillBuffers();
    }

    private void BlockAction(int item)
    {
      Console.WriteLine(item);
      Thread.Sleep(2000);
    }

    private void FillBuffers()
    {
      for (int i = 0; i < 1000; i++)
      {
        if (i % 2 == 0)
        {
          m_bufferBlock1.Post(i);
        }
        else
        {
          m_bufferBlock2.Post(i);
        }
      }
    }

    private bool IsTimeElapsed(DateTime start, TimeSpan elapsed)
    {
      Console.WriteLine("checking time elapsed");
      return DateTime.Now > (start + elapsed);
    }

    public async Task Start()
    {
      await m_actionBlock.Completion;
    }
  }

该代码建立了一个测试管道,并用奇数和偶数填充了两个缓冲区。两个BufferBlock都连接到一个ActionBlock,该ActionBlock仅打印“已处理”的数字并等待2秒。

从m_bufferBlock1和m_actionBlock之间的筛选条件检查(出于测试目的)自从开始整个过程​​以来是否经过了1分钟。

如果运行此命令,它将生成以下输出:

1
checking time elapsed
3
5
7
9
11
13
15
17
19

我们可以看到,ActionBlock从不带过滤器的BufferBlock中获取第一个元素,然后尝试从带过滤器的BufferBlock中获取一个元素。过滤器的计算结果为false,它将继续从不使用过滤器的模块中获取所有元素。

我的期望是,在处理了不带过滤器的BufferBlock中的元素之后,它将尝试再次从另一个带过滤器的BufferBlock中获取该元素,并再次对其求值。

这将是我的预期(或期望)结果:

1
checking time elapsed
3
checking time elapsed
5
checking time elapsed
7
checking time elapsed
9
checking time elapsed
11
checking time elapsed
13
checking time elapsed
15
// after timer has elapsed take elements also from other buffer
2
17
4
19

我现在的问题是,是否有一种方法可以“重置”已经“拒绝”的消息,以便再次对其进行评估,还是有另一种方法可以通过对它进行不同的建模?概括地说,严格地交替从两个缓冲区中拉出它们并不重要! (因为我知道这是依赖于调度的,所以不时将同一块中的2个项目出队是完全可以的) 但是重要的是,切勿丢弃或重新排队“已拒绝”消息,因为一个缓冲区内的顺序很重要。

提前谢谢

1 个答案:

答案 0 :(得分:0)

一个想法是定期或按需刷新两个模块之间的链接。实现定期可刷新的NuGet Package并不是很困难。这是一个实现:

5 (transfer time)

用法示例:

public static IDisposable LinkTo<TOutput>(this ISourceBlock<TOutput> source,
    ITargetBlock<TOutput> target, Predicate<TOutput> predicate,
    TimeSpan refreshInterval, DataflowLinkOptions linkOptions = null)
{
    if (source == null) throw new ArgumentNullException(nameof(source));
    if (target == null) throw new ArgumentNullException(nameof(target));
    if (predicate == null) throw new ArgumentNullException(nameof(predicate));
    if (refreshInterval < TimeSpan.Zero)
        throw new ArgumentOutOfRangeException(nameof(refreshInterval));
    linkOptions = linkOptions ?? new DataflowLinkOptions();

    var locker = new object();
    var cts = new CancellationTokenSource();
    var token = cts.Token;
    var currentLink = source.LinkTo(target, linkOptions, predicate);
    var loopTask = Task.Run(async () =>
    {
        try
        {
            while (true)
            {
                await Task.Delay(refreshInterval, token).ConfigureAwait(false);
                currentLink.Dispose();
                currentLink = source.LinkTo(target, linkOptions, predicate);
            }
        }
        finally
        {
            lock (locker) { cts.Dispose(); cts = null; }
        }
    }, token);

    _ = Task.Factory.ContinueWhenAny(new[] { source.Completion, target.Completion },
        _ => { lock (locker) cts?.Cancel(); }, token, TaskContinuationOptions.None,
        TaskScheduler.Default);

    return new Unlinker(() =>
    {
        lock (locker) cts?.Cancel();
        // Wait synchronously the task to complete, ignoring cancellation exceptions.
        try { loopTask.GetAwaiter().GetResult(); } catch (OperationCanceledException) { }
        currentLink.Dispose();
    });
}

private struct Unlinker : IDisposable
{
    private readonly Action _action;
    public Unlinker(Action disposeAction) => _action = disposeAction;
    void IDisposable.Dispose() => _action?.Invoke();
}

m_bufferBlock1.LinkTo(m_actionBlock, x => IsTimeElapsed(start, elapsed), refreshInterval: TimeSpan.FromSeconds(10)); m_bufferBlock1之间的链接将每10秒刷新一次,直到两个块之一完成。