为什么foreach与Parallel.ForEach之间存在这种差异?

时间:2013-10-21 11:05:04

标签: c# .net foreach parallel.foreach

任何人都可以用简单的语言向我解释为什么我在使用foreach时获得大约65 k的文件,在使用Parallel.ForEach时获得大于3 GB的文件?

foreach的代码:

// start node xml document
var logItems = new XElement("log", new XAttribute("start", DateTime.Now.ToString("yyyy-MM-ddTHH:mm:ss")));
var products = new ProductLogic().SelectProducts();
var productGroupLogic = new ProductGroupLogic();
var productOptionLogic = new ProductOptionLogic();
// loop through all products
foreach (var product in products)
{
    // is in a specific group
    var id = Convert.ToInt32(product["ProductID"]);
    var isInGroup = productGroupLogic.GetProductGroups(new int[] { id }.ToList(), groupId).Count > 0;
    // get product stock per option
    var productSizes = productOptionLogic.GetProductStockByProductId(id).ToList();
    // any stock available
    var stock = productSizes.Sum(ps => ps.Stock);
    var hasStock = stock > 0;
    // get webpage for this product
    var productUrl = string.Format(url, id);
    var htmlPage = Html.Page.GetWebPage(productUrl);
    // check if there is anything to log
    var addToLog = false;
    XElement sizeElements = null;
    // if has no stock or in group
    if (!hasStock || isInGroupNew)
    {
        // page shows => not ok => LOG!
        if (!htmlPage.NotFound) addToLog = true;
    }
    // if page is ok
    if (htmlPage.IsOk)
    {
        sizeElements = GetSizeElements(htmlPage.Html, productSizes);
        addToLog = sizeElements != null;
    }
    if (addToLog) logItems.Add(CreateElement(productUrl, htmlPage, stock, isInGroup, sizeElements));
}
// save
var xDocument = new XDocument(new XDeclaration("1.0", "utf-8", "yes"), new XElement("log", logItems));
xDocument.Save(fileName);

使用并行代码是一个小改动,只需用Parallel.ForEach替换foreach:

// loop through all products
Parallel.ForEach(products, product =>
{
    ... code ...
};

方法GetSizeElements和CreateElements都是静态的。

UPDATE1 我使用锁定方法GetSizeElements和CreateElements线程安全,也没有帮助。

UPDATE2 我得到了解决问题的答案。那太好了。但我想更多地了解为什么这些代码创建的文件比foreach解决方案大得多。我正在尝试使用线程时代码如何工作更有意义。通过这种方式,我可以获得更多的洞察力,并且可以学会避免陷阱。

2 个答案:

答案 0 :(得分:2)

有一件事突出:

if (addToLog) 
  logItems.Add(CreateElement(productUrl, htmlPage, stock, isInGroup, sizeElements));

logItems不是安全的。这可能是你的核心问题,但还有很多其他的可能性。

您有输出文件,寻找差异。

答案 1 :(得分:1)

尝试在foreach循环中定义以下参数。

var productGroupLogic = new ProductGroupLogic();
var productOptionLogic = new ProductOptionLogic();

我认为只有两个被并行foreach循环中的所有线程使用,结果不必要地增加。