希望有人能帮我解决问题。
我正在尝试使用以下代码获取网站的html代码:
public string DownloadString(string add)
{
string html = "";
using (WebClient client = new WebClient())
{
client.Proxy = null;
client.Headers.Add("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705;)");
while (html == "")
{
try
{
html = client.DownloadString(add);
}
catch (WebException e)
{
html = "";
}
}
client.Dispose();
}
return html;
}
我需要此函数中的字符串(调用者):
public HtmlNode get_html(string add)
{
add_val(add);
Uri madd = new Uri(add);
Stopwatch timer = Stopwatch.StartNew();
Task<string> task = Task.Factory.StartNew<string>
(() => DownloadString(add));
string html = task.Result;
//string html = DownloadString(add);
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
//doc.Load(new StringReader(html));
doc.LoadHtml(html);
HtmlNode root = doc.DocumentNode;
timer.Stop();
TimeSpan timespan = timer.Elapsed;
label18.Text = String.Format("{0:00}:{1:00}:{2:00}", timespan.Minutes, timespan.Seconds, timespan.Milliseconds / 10);
return root;
}
我已经尝试了html = await client.DownloadStringTaskAsync(new Uri(add));
但它似乎无法正常工作,当我下载字符串时它仍会冻结用户界面。
提前谢谢!
答案 0 :(得分:1)
为了防止阻止UI,您的代码需要一直是异步。
此代码特别阻止UI线程,直到下载完成:
Task<string> task = Task.Factory.StartNew<string>(() => DownloadString(add));
string html = task.Result;
您需要的是使用await
代替:
Task<string> task = Task.Run(() => DownloadString(add));
string html = await task;
这意味着您的get_html
方法必须为async
:
public async Task<HtmlNode> get_htmlAsync(string add)
所有调用者必须使用await
,并成为async
等。您必须允许异步在调用者树中一直增长。
答案 1 :(得分:1)
这里的问题是对task.Result
的调用总是阻塞(如果任务没有准备好,调用线程将等待完成),那么你的UI线程将被阻塞,等待任务结果。您需要做什么,如果您正在使用.Net Framework 4(@Stephen为4.5编写解决方案)是以下列方式使用continuation。
public void get_html(string add)
{
add_val(add);
Uri madd = new Uri(add);
Stopwatch timer = Stopwatch.StartNew();
Task.Factory.StartNew<string>(() => DownloadString(add))
.ContinueWith(t => {
string html = task.Result;
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
HtmlNode root = doc.DocumentNode;
timer.Stop();
TimeSpan timespan = timer.Elapsed;
label18.Text = String.Format("{0:00}:{1:00}:{2:00}", timespan.Minutes, timespan.Seconds, timespan.Milliseconds / 10);
//
Update UI with results here
//
}, TaskScheduler.FromCurrentSynchronizationContext());
}
或者,您可以将get_html
返回类型设置为Task<string>
或Task<HtmlNode>
,以便对其使用延续。