关于使用并行Web的任务队列获取代码的问题

时间:2011-08-16 01:57:42

标签: c# multithreading multitasking

所以我已经有了这段代码,可以从REST api深入研究XML文档的层次结构。我posted earlier得到关于如何使其递归的建议,然后我继续将其变为parralel。

首先,我被它运行的速度感到震惊 - 它在不到12秒的时间内拉下了318个XML文档,相比之下,超过10分钟的单线程 - 我真的没想到会获得那么多。是否有一些问题,因为它看起来好得令人难以置信?

其次,我怀疑这段代码正在实现一个共同的模式,但可能是非“惯用”的方式。我发生了一种“生产者 - 消费者队列”,有两个独立的锁定对象。有没有更标准的方法可以做到这一点?

代码。

        public class ResourceGetter
        {
            public ResourceGetter(ILogger logger, string url)
            {
                this.logger = logger;
                this.rootURL = url;
            }
            public List<XDocument> GetResources()
            {
                GetResources(rootURL);
                while (NumTasks() > 0) RemoveTask().Wait();
                return resources;
            }
            void GetResources(string url)
            {
                logger.Log("Getting resources at " + url);
                AddTask(Task.Factory.StartNew(new Action(() =>
                {
                    var doc = XDocument.Parse(GetXml(url));
                    if (deserializer.CanDeserialize(doc.CreateReader()))
                    {
                        var rl = (resourceList)deserializer.Deserialize(doc.CreateReader());
                        foreach (var item in rl.resourceURL)
                        {
                            GetResources(url + item.location);
                        }
                    }
                    else
                    {
                        logger.Log("Got resource for " + url);
                        AddResrouce(doc);
                    }
                })));
            }
            object resourceLock = new object();
            List<XDocument> resources = new List<XDocument>();
            void AddResrouce(XDocument doc)
            {
                lock (resourceLock)
                {
                    logger.Log("add resource");
                    resources.Add(doc);
                }
            }
            object taskLock = new object();
            Queue<Task> tasks = new Queue<Task>();
            void AddTask(Task task)
            {
                lock (taskLock)
                {
                    tasks.Enqueue(task);
                }
            }
            Task RemoveTask()
            {

                lock (taskLock)
                {
                    return tasks.Dequeue();
                }
            }
            int NumTasks()
            {
                lock (taskLock)
                {
                    logger.Log(tasks.Count + " tasks left");
                    return tasks.Count;
                }
            }
            ILogger logger;
            XmlSerializer deserializer = new XmlSerializer(typeof(resourceList));
            readonly string rootURL;
        }

1 个答案:

答案 0 :(得分:1)

只是随便,我不打扰管理任务列表,所有锁定和NumTasks()方法的代码。使用CountdownEvent会更简单,这是线程安全的开始。只需在创建新任务时递增它,并在任务完成时递减它,就像你现在正在做的那样但没有锁定。