下游的TPL数据流块如何获取源生成的数据?

时间:2013-01-30 19:51:16

标签: c# .net task-parallel-library tpl-dataflow

我正在使用TPL Dataflow处理图像。我收到处理请求,从流中读取图像,应用多个转换,然后将生成的图像写入另一个流:

Request -> Stream -> Image -> Image ... -> Stream

为此,我使用块:

BufferBlock<Request>
TransformBlock<Request,Stream>
TransformBlock<Stream,Image>
TransformBlock<Image,Image>
TransformBlock<Image,Image>
...
writerBlock = new ActionBlock<Image>

问题是初始Request包含创建结果Stream所需的一些数据以及此时我需要的一些其他信息。我是否必须将原始Request(或其他一些上下文对象)传递到所有其他块的writerBlock,如下所示:

TransformBlock<Request,Tuple<Request,Stream>>
TransformBlock<Tuple<Request,Stream>,Tuple<Request,Image>>
TransformBlock<Tuple<Request,Image>,Tuple<Request,Image>>
...

(这是丑陋的),还是有办法将第一个块链接到最后一个块(或者,推广到需要附加数据的块)?

2 个答案:

答案 0 :(得分:7)

是的,您几乎需要执行您所描述的操作,将每个块中的其他数据传递给下一个块。

但是使用几种辅助方法,可以使这更简单:

public static IPropagatorBlock<TInput, Tuple<TOutput, TInput>>
    CreateExtendedSource<TInput, TOutput>(Func<TInput, TOutput> transform)
{
    return new TransformBlock<TInput, Tuple<TOutput, TInput>>(
        input => Tuple.Create(transform(input), input));
}

public static IPropagatorBlock<Tuple<TInput, TExtension>, Tuple<TOutput, TExtension>>
    CreateExtendedTransform<TInput, TOutput, TExtension>(Func<TInput, TOutput> transform)
{
    return new TransformBlock<Tuple<TInput, TExtension>, Tuple<TOutput, TExtension>>(
        tuple => Tuple.Create(transform(tuple.Item1), tuple.Item2));
}

签名看起来令人生畏,但实际上并没有那么糟糕。

此外,您可能希望添加将选项传递给创建的块的重载,或者重载以获取异步委托的重载。

例如,如果您想使用单独的块对数字执行某些操作,同时沿途传递原始数字,您可以执行以下操作:

var source = new BufferBlock<int>();
var divided = CreateExtendedSource<int, double>(i => i / 2.0);
var formatted = CreateExtendedTransform<double, string, int>(d => d.ToString("0.0"));
var writer = new ActionBlock<Tuple<string, int>>(tuple => Console.WriteLine(tuple));

source.LinkTo(divided);
divided.LinkTo(formatted);
formatted.LinkTo(writer);

for (int i = 0; i < 10; i++)
    source.Post(i);

正如您所看到的,您的lambdas(最后一个除外)仅处理“当前”值(intdoublestring,具体取决于管道),“原始”值(总是int)自动传递。在任何时候,您都可以使用使用普通构造函数创建的块来访问这两个值(例如示例中的最终ActionBlock)。

BufferBlock实际上并不是必需的,但我添加它以更贴合您的设计。)

答案 1 :(得分:2)

由于我刚刚开始使用TPL Dataflow,我可能会过头了。 但我相信您可以使用BroadcastBlock作为源与您的第一个目标之间的媒介来实现这一目标。

BroadcastBlock可以向多个目标提供消息,因此您可以使用它向目标提供也提供给JoinBlock,最后将合并结果与原始消息。

source -> Broadcast ->-----------------------------------------> JoinBlock <source, result>
                    -> Transformation1 -> Transformation 'n'  ->

例如:

var source = new BufferBlock<int>();
var transformation =  new TransformBlock<int, int>(i => i * 100);

var broadCast = new BroadcastBlock<int>(null);
source.LinkTo(broadCast);
broadCast.LinkTo(transformation);

var jb = new JoinBlock<int, int>();
broadCast.LinkTo(jb.Target1);
transformation.LinkTo(jb.Target2);

jb.LinkTo(new ActionBlock<Tuple<int, int>>(
          c => Console.WriteLine("Source:{0}, Target Result: {1}", c.Item1, c.Item2)));

source.Post(1);
source.Post(2);

source.Complete();

...产量

  

资料来源:1,目标结果:100

     

资料来源:2,目标结果:200

我不太确定它在异步环境中的表现。