任何人都可以用简单的语言向我解释为什么我在使用foreach时获得大约65 k的文件,在使用Parallel.ForEach时获得大于3 GB的文件?
foreach的代码:
// start node xml document
var logItems = new XElement("log", new XAttribute("start", DateTime.Now.ToString("yyyy-MM-ddTHH:mm:ss")));
var products = new ProductLogic().SelectProducts();
var productGroupLogic = new ProductGroupLogic();
var productOptionLogic = new ProductOptionLogic();
// loop through all products
foreach (var product in products)
{
// is in a specific group
var id = Convert.ToInt32(product["ProductID"]);
var isInGroup = productGroupLogic.GetProductGroups(new int[] { id }.ToList(), groupId).Count > 0;
// get product stock per option
var productSizes = productOptionLogic.GetProductStockByProductId(id).ToList();
// any stock available
var stock = productSizes.Sum(ps => ps.Stock);
var hasStock = stock > 0;
// get webpage for this product
var productUrl = string.Format(url, id);
var htmlPage = Html.Page.GetWebPage(productUrl);
// check if there is anything to log
var addToLog = false;
XElement sizeElements = null;
// if has no stock or in group
if (!hasStock || isInGroupNew)
{
// page shows => not ok => LOG!
if (!htmlPage.NotFound) addToLog = true;
}
// if page is ok
if (htmlPage.IsOk)
{
sizeElements = GetSizeElements(htmlPage.Html, productSizes);
addToLog = sizeElements != null;
}
if (addToLog) logItems.Add(CreateElement(productUrl, htmlPage, stock, isInGroup, sizeElements));
}
// save
var xDocument = new XDocument(new XDeclaration("1.0", "utf-8", "yes"), new XElement("log", logItems));
xDocument.Save(fileName);
使用并行代码是一个小改动,只需用Parallel.ForEach替换foreach:
// loop through all products
Parallel.ForEach(products, product =>
{
... code ...
};
方法GetSizeElements和CreateElements都是静态的。
UPDATE1 我使用锁定方法GetSizeElements和CreateElements线程安全,也没有帮助。
UPDATE2 我得到了解决问题的答案。那太好了。但我想更多地了解为什么这些代码创建的文件比foreach解决方案大得多。我正在尝试使用线程时代码如何工作更有意义。通过这种方式,我可以获得更多的洞察力,并且可以学会避免陷阱。
答案 0 :(得分:2)
有一件事突出:
if (addToLog)
logItems.Add(CreateElement(productUrl, htmlPage, stock, isInGroup, sizeElements));
logItems
不是安全的。这可能是你的核心问题,但还有很多其他的可能性。
您有输出文件,寻找差异。
答案 1 :(得分:1)
尝试在foreach循环中定义以下参数。
var productGroupLogic = new ProductGroupLogic();
var productOptionLogic = new ProductOptionLogic();
我认为只有两个被并行foreach循环中的所有线程使用,结果不必要地增加。