我有一个项目枚举(RunData.Demand
),每个项目代表一些涉及通过HTTP调用API的工作。如果我只是通过它foreach
并在每次迭代期间调用API,那么它的效果很好。但是,每次迭代需要一两秒钟,所以我想运行2-3个线程并在它们之间划分工作。这就是我正在做的事情:
ThreadPool.SetMaxThreads(2, 5); // Trying to limit the amount of threads
var tasks = RunData.Demand
.Select(service => Task.Run(async delegate
{
var availabilityResponse = await client.QueryAvailability(service);
// Do some other stuff, not really important
}));
await Task.WhenAll(tasks);
client.QueryAvailability
调用基本上使用HttpClient
类调用API:
public async Task<QueryAvailabilityResponse> QueryAvailability(QueryAvailabilityMultidayRequest request)
{
var response = await client.PostAsJsonAsync("api/queryavailabilitymultiday", request);
if (response.IsSuccessStatusCode)
{
return await response.Content.ReadAsAsync<QueryAvailabilityResponse>();
}
throw new HttpException((int) response.StatusCode, response.ReasonPhrase);
}
这种方法很有效,但最终事情开始超时。如果我将HttpClient超时设置为一小时,那么我开始得到奇怪的内部服务器错误。
我开始做的是在QueryAvailability
方法中设置一个秒表,看看发生了什么。
正在发生的事情是RunData.Demand中的所有1200个项目一次创建,并且正在调用所有1200个await client.PostAsJsonAsync
方法。它似乎然后使用2个线程慢慢检查任务,所以最后我有等待9或10分钟的任务。
这是我想要的行为:
我想创建1,200个任务,然后在线程可用时一次运行3-4个任务。我不想立即排队1,200个HTTP呼叫。
有没有好办法做到这一点?
答案 0 :(得分:21)
我总是建议..你需要的是TPL Dataflow(安装:Install-Package Microsoft.Tpl.Dataflow
)。
您创建一个ActionBlock
,其中包含要对每个项目执行的操作。设置MaxDegreeOfParallelism
以进行限制。开始发帖并等待其完成:
var block = new ActionBlock<QueryAvailabilityMultidayRequest>(async service =>
{
var availabilityResponse = await client.QueryAvailability(service);
// ...
},
new ExecutionDataflowBlockOptions { MaxDegreeOfParallelism = 4 });
foreach (var service in RunData.Demand)
{
block.Post(service);
}
block.Complete();
await block.Completion;
答案 1 :(得分:4)
老问题,但我想提出一个使用SemaphoreSlim类的替代轻量级解决方案。只需参考System.Threading。
SemaphoreSlim sem = new SemaphoreSlim(4,4);
foreach (var service in RunData.Demand)
{
await sem.WaitAsync();
Task t = Task.Run(async () =>
{
var availabilityResponse = await client.QueryAvailability(serviceCopy));
// do your other stuff here with the result of QueryAvailability
}
t.ContinueWith(sem.Release());
}
信号量充当锁定机制。您只能通过调用Wait(WaitAsync)来输入信号量,Wait(WaitAsync)从计数中减去一个。调用版本会增加一个计数。
答案 2 :(得分:3)
您正在使用异步HTTP调用,因此限制线程数将无济于事(ParallelOptions.MaxDegreeOfParallelism
中的Parallel.ForEach
也不会如其中一个答案所示。即使是单个线程也可以启动所有请求并在结果到达时处理结果。
解决这个问题的一种方法是使用TPL Dataflow。
另一个不错的解决方案是将源IEnumerable
划分为分区并按顺序处理每个分区中的项目,如this blog post中所述:
public static Task ForEachAsync<T>(this IEnumerable<T> source, int dop, Func<T, Task> body)
{
return Task.WhenAll(
from partition in Partitioner.Create(source).GetPartitions(dop)
select Task.Run(async delegate
{
using (partition)
while (partition.MoveNext())
await body(partition.Current);
}));
}
答案 3 :(得分:3)
虽然Dataflow库很棒,但我认为在不使用块组合时它有点重。我倾向于使用类似下面的扩展方法。
此外,与分区程序方法不同,它在调用上下文中运行异步方法 - 需要注意的是,如果您的代码不是真正的异步,或者采用快速路径,那么它将有效地运行同步,因为没有显式创建线程。
public static async Task RunParallelAsync<T>(this IEnumerable<T> items, Func<T, Task> asyncAction, int maxParallel)
{
var tasks = new List<Task>();
foreach (var item in items)
{
tasks.Add(asyncAction(item));
if (tasks.Count < maxParallel)
continue;
var notCompleted = tasks.Where(t => !t.IsCompleted).ToList();
if (notCompleted.Count >= maxParallel)
await Task.WhenAny(notCompleted);
}
await Task.WhenAll(tasks);
}