我有一个C#程序,目前同步从多个站点下载数据,之后代码对我下载的数据进行了一些处理。我试图移动它以异步方式进行下载,然后处理我下载的数据。我在测序方面遇到了一些麻烦。下面是我正在使用的代码的快照:
class Program
{
static void Main(string[] args)
{
Console.WriteLine("Started URL downloader");
UrlDownloader d = new UrlDownloader();
d.Process();
Console.WriteLine("Finished URL downloader");
Console.ReadLine();
}
}
class UrlDownloader
{
public void Process()
{
List<string> urls = new List<string>() {
"http://www.stackoverflow.com",
"http://www.microsoft.com",
"http://www.apple.com",
"http://www.google.com"
};
foreach (var url in urls)
{
WebClient Wc = new WebClient();
Wc.OpenReadCompleted += new OpenReadCompletedEventHandler(DownloadDataAsync);
Uri varUri = new Uri(url);
Wc.OpenReadAsync(varUri, url);
}
}
void DownloadDataAsync(object sender, OpenReadCompletedEventArgs e)
{
StreamReader k = new StreamReader(e.Result);
string temp = k.ReadToEnd();
PrintWebsiteTitle(temp, e.UserState as string);
}
void PrintWebsiteTitle(string temp, string source)
{
Regex reg = new Regex(@"<title[^>]*>(.*)</title[^>]*>");
string title = reg.Match(temp).Groups[1].Value;
Console.WriteLine(new string('*', 10));
Console.WriteLine("Source: {0}, Title: {1}", source, title);
Console.WriteLine(new string('*', 10));
}
}
基本上,我的问题是这个。我的输出是:
Started URL downloader
Finished URL downloader
"Results of d.Process()"
我想要做的是完成d.Process()方法,然后返回我的Program类中的“Main”方法。所以,我要找的输出是:
Started URL downloader
"Results of d.Process()"
Finished URL downloader
我的d.Process()方法异步运行,但我无法弄清楚如何在返回到我的Main方法之前等待所有处理完成。有关如何在C#4.0中执行此操作的任何想法?我不知道如何“告诉”我的Process()方法等到所有异步活动完成后再返回Main方法。
答案 0 :(得分:8)
如果您使用.NET&gt; = 4.0,则可以使用TPL
Parallel.ForEach(urls, url =>
{
WebClient Wc = new WebClient();
string page = Wc.DownloadString(url);
PrintWebsiteTitle(page);
});
我还会使用HtmlAgilityPack来解析页面而不是正则表达式。
void PrintWebsiteTitle(string page)
{
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(page);
Console.WriteLine(doc.DocumentNode.Descendants("title").First().InnerText);
}
答案 1 :(得分:0)
我建议使用WebClient.DownloadDataAsync而不是自己编写。然后,您可以使用任务并行库将调用包装到TaskCompletionSource中的DownloadDataAsync,以获取您可以等待或继续的多个Task对象:
webClient.DownloadDataAsync(myUri);
webClient.DownloadDataCompleted += (s, e) =>
{
tcs.TrySetResult(e.Result);
};
if (wait)
{
tcs.Task.Wait();
Console.WriteLine("got {0} bytes", tcs.Task.Result.Length);
}
else
{
tcs.Task.ContinueWith(t => Console.WriteLine("got {0} bytes", t.Result.Length));
}
要处理错误情况,您可以扩展TaskCompletionSource的使用:
webClient.DownloadDataCompleted += (s, e) =>
{
if(e.Error != null) tcs.SetException(e.Error);
else if(e.Cancelled) tcs.SetCanceled();
else tcs.TrySetResult(e.Result);
};
与多项任务类似:
Task.WaitAll(tcs.Task, tcs2.Task);
或
Task.Factory.ContinueWhenAll(new Task[] {tcs.Task, tcs2.Task}, ts =>
{
/* do something with all the results */
});