我正在尝试使用RequestHandler.ParseAll()
阻止await ConsumerTask;
,但是当我在那里设置断点时,我总是首先得到“完成...”输出...然后Parse2()
失败并出现NullReferenceException。 (这就是我的猜测:“GC开始清理因为_handler
超出了范围”)
无论如何,我无法弄清楚为什么会这样。
class MainClass
{
public async void DoWork()
{
RequestHandler _handler = new RequestHandler();
string[] mUrls;
/* fill mUrls here with values */
await Task.Run(() => _handler.ParseSpecific(mUrls));
Console.WriteLine("Done...");
}
}
static class Parser
{
public static async Task<IEnumerable<string>> QueryWebPage(string url) { /*Query the url*/ }
public static async Task Parse1(Query query)
{
Parallel.ForEach(/*Process data here*/);
}
public static async Task Parse2(Query query)
{
foreach(string line in query.WebPage)
/* Here i get a NullReference exception because query.WebPage == null */
}
}
sealed class RequestHandler
{
private BlockingCollection<Query> Queue;
private Task ConsumerTask = Task.Run(() => /* call consume() for each elem in the queue*/);
private async void Consume(Query obj)
{
await (obj.BoolField ? Parser.Parse1(obj) : Parser.Parse2(obj));
}
public async void ParseSpecific(string[] urls)
{
foreach(string v in urls)
Queue.Add(new Query(await QueryWebPage(v), BoolField: false));
Queue.CompleteAdding();
await ConsumerTask;
await ParseAll(true);
}
private async Task ParseAll(bool onlySome)
{
ReInit();
Parallel.ForEach(mCollection, v => Queue.Add(new Query(url, BoolField:false)));
Queue.CompleteAdding();
await ConsumerTask;
/* Process stuff further */
}
}
struct Query
{
public readonly string[] WebPage;
public readonly bool BoolField;
public Query(uint e, IEnumerable<string> page, bool b) : this()
{
Webpage = page.ToArray();
BoolField = b;
}
}
答案 0 :(得分:6)
CodesInChaos在评论中发现了问题。它源于异步方法返回void
,你几乎从不做 - 这意味着你无法跟踪它们。
相反,如果您的异步方法没有任何实际值要返回,那么您应该让它们返回Task
。
正在发生的事情是ParseSpecific
只是同步运行,直到第一个await QueryWebPage(v)
没有立即完成。它然后返回...所以任务从这里开始:
await Task.Run(() => _handler.ParseSpecific(mUrls));
...立即完成,并打印“完成”。
一旦你的所有异步方法都返回Task
,你就可以等待它们了。您根本不需要Task.Run
。所以你有:
public async void DoWork()
{
RequestHandler _handler = new RequestHandler();
string[] mUrls;
await _handler.ParseSpecific(mUrls);
Console.WriteLine("Done...");
}
...
public async TaskParseSpecific(string[] urls)
{
foreach(string v in urls)
{
// Refactored for readability, although I'm not sure it really
// makes sense now that it's clearer! Are you sure this is what
// you want?
var page = await QueryWebPage(v);
Queue.Add(new Query(page, false);
}
Queue.CompleteAdding();
await ConsumerTask;
await ParseAll(true);
}
您的Reinit
方法也需要更改,因为目前ConsumerTask
基本上会立即完成,因为Consume
会立即返回,因为另一个异步方法返回空隙。
老实说,如果没有正确理解async / await,你所拥有的东西看起来非常复杂。我会在async / await上阅读更多信息,然后可能从头开始。我强烈怀疑你能做到这么多,简单得多。您可能还想阅读TPL Dataflow,它旨在简化生产者/消费者场景。