我正在为我的应用程序使用TDF,到目前为止,它运行良好,不幸的是,我偶然发现了一个特定问题,似乎无法使用现有的Dataflow机制直接处理该问题:
我有N个生产者(在这种情况下为BufferBlocks),这些生产者都仅链接到1个(均相同)ActionBlock。此块始终一次处理1个项目,并且只能容纳1个项目。
从生产者到ActionBlock的链接中,我还想添加一个过滤器,但是这里的特殊情况是,过滤器条件可以独立于处理过的项目而改变,并且不得丢弃该项目! 因此,基本上我想处理所有项目,但是处理项目的时间/顺序可以更改。
不幸的是,我了解到,如果某个项目被“拒绝”一次->过滤条件为false,并且如果该项目未传递到另一个块(例如NullTarget),则目标块不会重试相同的项目(并且不会重新评估过滤器。)
public class ConsumeTest
{
private readonly BufferBlock<int> m_bufferBlock1;
private readonly BufferBlock<int> m_bufferBlock2;
private readonly ActionBlock<int> m_actionBlock;
public ConsumeTest()
{
m_bufferBlock1 = new BufferBlock<int>();
m_bufferBlock2 = new BufferBlock<int>();
var options = new ExecutionDataflowBlockOptions() { BoundedCapacity = 1, MaxDegreeOfParallelism = 1 };
m_actionBlock = new ActionBlock<int>((item) => BlockAction(item), options);
var start = DateTime.Now;
var elapsed = TimeSpan.FromMinutes(1);
m_bufferBlock1.LinkTo(m_actionBlock, x => IsTimeElapsed(start, elapsed));
m_bufferBlock2.LinkTo(m_actionBlock);
FillBuffers();
}
private void BlockAction(int item)
{
Console.WriteLine(item);
Thread.Sleep(2000);
}
private void FillBuffers()
{
for (int i = 0; i < 1000; i++)
{
if (i % 2 == 0)
{
m_bufferBlock1.Post(i);
}
else
{
m_bufferBlock2.Post(i);
}
}
}
private bool IsTimeElapsed(DateTime start, TimeSpan elapsed)
{
Console.WriteLine("checking time elapsed");
return DateTime.Now > (start + elapsed);
}
public async Task Start()
{
await m_actionBlock.Completion;
}
}
该代码建立了一个测试管道,并用奇数和偶数填充了两个缓冲区。两个BufferBlock都连接到一个ActionBlock,该ActionBlock仅打印“已处理”的数字并等待2秒。
从m_bufferBlock1和m_actionBlock之间的筛选条件检查(出于测试目的)自从开始整个过程以来是否经过了1分钟。
如果运行此命令,它将生成以下输出:
1
checking time elapsed
3
5
7
9
11
13
15
17
19
我们可以看到,ActionBlock从不带过滤器的BufferBlock中获取第一个元素,然后尝试从带过滤器的BufferBlock中获取一个元素。过滤器的计算结果为false,它将继续从不使用过滤器的模块中获取所有元素。
我的期望是,在处理了不带过滤器的BufferBlock中的元素之后,它将尝试再次从另一个带过滤器的BufferBlock中获取该元素,并再次对其求值。
这将是我的预期(或期望)结果:
1
checking time elapsed
3
checking time elapsed
5
checking time elapsed
7
checking time elapsed
9
checking time elapsed
11
checking time elapsed
13
checking time elapsed
15
// after timer has elapsed take elements also from other buffer
2
17
4
19
我现在的问题是,是否有一种方法可以“重置”已经“拒绝”的消息,以便再次对其进行评估,还是有另一种方法可以通过对它进行不同的建模?概括地说,严格地交替从两个缓冲区中拉出它们并不重要! (因为我知道这是依赖于调度的,所以不时将同一块中的2个项目出队是完全可以的) 但是重要的是,切勿丢弃或重新排队“已拒绝”消息,因为一个缓冲区内的顺序很重要。
提前谢谢
答案 0 :(得分:0)
一个想法是定期或按需刷新两个模块之间的链接。实现定期可刷新的NuGet Package并不是很困难。这是一个实现:
5 (transfer time)
用法示例:
public static IDisposable LinkTo<TOutput>(this ISourceBlock<TOutput> source,
ITargetBlock<TOutput> target, Predicate<TOutput> predicate,
TimeSpan refreshInterval, DataflowLinkOptions linkOptions = null)
{
if (source == null) throw new ArgumentNullException(nameof(source));
if (target == null) throw new ArgumentNullException(nameof(target));
if (predicate == null) throw new ArgumentNullException(nameof(predicate));
if (refreshInterval < TimeSpan.Zero)
throw new ArgumentOutOfRangeException(nameof(refreshInterval));
linkOptions = linkOptions ?? new DataflowLinkOptions();
var locker = new object();
var cts = new CancellationTokenSource();
var token = cts.Token;
var currentLink = source.LinkTo(target, linkOptions, predicate);
var loopTask = Task.Run(async () =>
{
try
{
while (true)
{
await Task.Delay(refreshInterval, token).ConfigureAwait(false);
currentLink.Dispose();
currentLink = source.LinkTo(target, linkOptions, predicate);
}
}
finally
{
lock (locker) { cts.Dispose(); cts = null; }
}
}, token);
_ = Task.Factory.ContinueWhenAny(new[] { source.Completion, target.Completion },
_ => { lock (locker) cts?.Cancel(); }, token, TaskContinuationOptions.None,
TaskScheduler.Default);
return new Unlinker(() =>
{
lock (locker) cts?.Cancel();
// Wait synchronously the task to complete, ignoring cancellation exceptions.
try { loopTask.GetAwaiter().GetResult(); } catch (OperationCanceledException) { }
currentLink.Dispose();
});
}
private struct Unlinker : IDisposable
{
private readonly Action _action;
public Unlinker(Action disposeAction) => _action = disposeAction;
void IDisposable.Dispose() => _action?.Invoke();
}
m_bufferBlock1.LinkTo(m_actionBlock, x => IsTimeElapsed(start, elapsed),
refreshInterval: TimeSpan.FromSeconds(10));
和m_bufferBlock1
之间的链接将每10秒刷新一次,直到两个块之一完成。