与HttpClient和ContinueWith的Parallel.ForEach

时间:2013-10-15 14:33:28

标签: c# asynchronous task-parallel-library async-await dotnet-httpclient

我有一种方法尝试从并行的多个网址下载数据,并返回IEnumerable反序列化类型

方法如下:

    public IEnumerable<TContent> DownloadContentFromUrls(IEnumerable<string> urls)
    {
        var list = new List<TContent>();

        Parallel.ForEach(urls, url =>
        {
            lock (list)
            {
                _httpClient.GetAsync(url).ContinueWith(request =>
                {
                    var response = request.Result;
                    //todo ensure success?

                    response.Content.ReadAsStringAsync().ContinueWith(text =>
                    {
                        var results = JObject.Parse(text.Result)
                            .ToObject<IEnumerable<TContent>>();

                        list.AddRange(results);
                    });
                });
            }
        });

        return list;
    }

在我的单元测试中(我存根_httpClient返回一组已知的文本)我基本上得到了

  

序列不包含元素

这是因为该方法在任务完成之前返回。

如果我在.ContinueWith()调用结束时添加.Wait(),它会通过,但我确定我在这里滥用了API ...

1 个答案:

答案 0 :(得分:7)

如果你想要一个使用HttpClient.GetAsync方法并行下载的阻塞调用,那么你应该这样实现它:

public IEnumerable<TContent> DownloadContentFromUrls<TContent>(IEnumerable<string> urls)
{
    var queue = new ConcurrentQueue<TContent>();

    using (var client = new HttpClient())
    {
        Task.WaitAll(urls.Select(url =>
        {
            return client.GetAsync(url).ContinueWith(response =>
            {
                var content = JsonConvert.DeserializeObject<IEnumerable<TContent>>(response.Result.Content.ReadAsStringAsync().Result);

                foreach (var c in content)
                    queue.Enqueue(c);
            });
        }).ToArray());
    }

    return queue;
}

这将创建一个任务数组,每个Url对应一个任务,表示GetAsync / Deserialize操作。这假设Url返回TContent的Json数组。空数组或单个成员数组将反序列化精细,但不是单个无数组对象。