我希望将依赖任务排队到需要按顺序处理的多个流中(在每个流程中)。流可以并行处理。
具体来说,假设我需要两个队列,并且我希望按顺序处理每个队列中的任务。以下是用于说明所需行为的示例伪代码:
Queue1_WorkItem wi1a=...;
enqueue wi1a;
... time passes ...
Queue1_WorkItem wi1b=...;
enqueue wi1b; // This must be processed after processing of item wi1a is complete
... time passes ...
Queue2_WorkItem wi2a=...;
enqueue wi2a; // This can be processed concurrently with the wi1a/wi1b
... time passes ...
Queue1_WorkItem wi1c=...;
enqueue wi1c; // This must be processed after processing of item wi1b is complete
这是一个图表,带有箭头,说明了工作项之间的依赖关系:
问题是如何使用C#4.0 / .NET 4.0执行此操作?现在我有两个工作线程,每个队列一个,我为每个队列使用BlockingCollection<>
。我想改为利用.NET线程池并让工作线程同时处理项目(跨流程),但是在流程中连续处理。换句话说,我希望能够表明,例如wi1b取决于wi1a的完成,而不必跟踪完成并记住wi1a,当wi1b到达时。换句话说,我只想说,“我想为queue1提交一个工作项,它将与我已经为queue1提交的其他项目串行处理,但可能与提交给其他队列的工作项目并行”。
我希望这种描述有意义。如果没有,请随时在评论中提问,我会相应地更新这个问题。
感谢阅读。
更新
总结到目前为止“有缺陷”的解决方案,以下是我不能使用的答案部分的解决方案以及我不能使用它们的原因:
TPL任务需要指定ContinueWith()
的前期任务。我不想在提交新任务时保持每个队列的先行任务的知识。
TDF ActionBlocks看起来很有希望,但似乎发布到ActionBlock的项目是并行处理的。我需要连续处理特定队列的项目。
更新2:
RE:ActionBlocks
似乎将MaxDegreeOfParallelism
选项设置为1可防止并行处理提交到单个ActionBlock
的工作项。因此,似乎每个队列有ActionBlock
解决了我的问题,唯一的缺点是这需要从Microsoft安装和部署TDF库,我希望有一个纯.NET 4.0解决方案。到目前为止,这是候选人接受的答案,除非有人能够找到一种方法来使用纯.NET 4.0解决方案,而不会退化为每个队列的工作线程(我已经在使用)。
答案 0 :(得分:4)
我知道你有很多队列而且不想捆绑线程。每个队列可以有ActionBlock个。 ActionBlock可以自动执行您需要的大部分操作:它以串行方式处理工作项,并且仅在工作挂起时才启动任务。当没有待处理的工作时,不会阻止任务/线程。
答案 1 :(得分:3)
最好的方法是使用Task Parallel Library (TPL)
和Continuations
。延续不仅允许您创建任务流,还可以处理您的异常。这是TPL的great introduction。但是要给你一些想法......
您可以使用
启动TPL任务Task task = Task.Factory.StartNew(() =>
{
// Do some work here...
});
现在,当先前任务完成(错误或成功)时,您可以使用ContinueWith
方法
Task task1 = Task.Factory.StartNew(() => Console.WriteLine("Antecedant Task"));
Task task2 = task1.ContinueWith(antTask => Console.WriteLine("Continuation..."));
所以task1
完成后,失败或被取消task2
'启动'并开始运行。请注意,如果task1
在到达第二行代码task2
之前已完成,则会安排立即执行。传递给第二个lambda的antTask
参数是对前一个任务的引用。有关详细示例,请参阅this link
您还可以传递先行任务的延续结果
Task.Factory.StartNew<int>(() => 1)
.ContinueWith(antTask => antTask.Result * 4)
.ContinueWith(antTask => antTask.Result * 4)
.ContinueWith(antTask =>Console.WriteLine(antTask.Result * 4)); // Prints 64.
请注意。请务必在提供的第一个链接中阅读异常处理,因为这可能会导致TPL误入歧途。
最后要特别注意你想要的是儿童任务。子任务是创建为AttachedToParent
的任务。在这种情况下,在所有子任务完成之前,延续不会运行
TaskCreationOptions atp = TaskCreationOptions.AttachedToParent;
Task.Factory.StartNew(() =>
{
Task.Factory.StartNew(() => { SomeMethod() }, atp);
Task.Factory.StartNew(() => { SomeOtherMethod() }, atp);
}).ContinueWith( cont => { Console.WriteLine("Finished!") });
我希望这会有所帮助。
编辑:您是否查看了ConcurrentCollections
,尤其是BlockngCollection<T>
。因此,在您的情况下,您可能会使用类似
public class TaskQueue : IDisposable
{
BlockingCollection<Action> taskX = new BlockingCollection<Action>();
public TaskQueue(int taskCount)
{
// Create and start new Task for each consumer.
for (int i = 0; i < taskCount; i++)
Task.Factory.StartNew(Consumer);
}
public void Dispose() { taskX.CompleteAdding(); }
public void EnqueueTask (Action action) { taskX.Add(Action); }
void Consumer()
{
// This seq. that we are enumerating will BLOCK when no elements
// are avalible and will end when CompleteAdding is called.
foreach (Action action in taskX.GetConsumingEnumerable())
action(); // Perform your task.
}
}
答案 2 :(得分:1)
基于TPL的.NET 4.0解决方案是可能的,同时隐藏了它需要在某处存储父任务的事实。例如:
class QueuePool
{
private readonly Task[] _queues;
public QueuePool(int queueCount)
{ _queues = new Task[queueCount]; }
public void Enqueue(int queueIndex, Action action)
{
lock (_queues)
{
var parent = _queue[queueIndex];
if (parent == null)
_queues[queueIndex] = Task.Factory.StartNew(action);
else
_queues[queueIndex] = parent.ContinueWith(_ => action());
}
}
}
这是对所有队列使用单个锁来说明这个想法。但是,在生产代码中,我会使用每个队列锁定来减少争用。
答案 3 :(得分:0)
看起来你已经拥有的设计是好的和有效的。您的工作线程(每个队列一个)是长时间运行的,因此如果您想要使用Task,请指定TaskCreationOptions.LongRunning
,以便获得专用的工作线程。
但是没有必要在这里使用ThreadPool。它不能为长期工作带来许多好处。