Parallel.ForEach()缺少列表项

时间:2013-09-09 13:53:06

标签: c# parallel.foreach

在不使用Parallel.ForEach()的测试中,处理了3500条记录。

但是对于Parellel,每次尝试都会处理随机数较少的记录。 (3402,3375,3471等)。我发现DBSet不支持parellel编程,所以我将我的项目移动到列表中,然后再处理列表。 (不理想)一些遗漏的记录作为空对象添加到List中。

我错过了什么?

       public int Execute(CalculateAutoClassRatesCommandRequest request)
        {
            int recordCount = 0;
            var autoClassCalculations = new List<AutoClassCalculation>();
            var options = new ParallelOptions { MaxDegreeOfParallelism = 2 };
            Parallel.ForEach(request.BaseCalculations, options, baseCalculation =>
                {
                    foreach (var autoClass in request.AutoClasses
                        .Where(autoClass => baseCalculation.BaseClassId == autoClass.BaseClassId)
                        .Where(autoClass => autoClass.AutoClassForms != null))
                    {
                        foreach (var form in autoClass.AutoClassForms)
                        {
                            recordCount++;
                            var calcRate = CreateAutoClassCalculation(autoClass.AutoClassRoundingRules, form, baseCalculation); 
autoClassCalculations.Add(calcRate);
                        }
                    }
                });

            foreach (var autoClassCalculation in autoClassCalculations)
            {
                request.AutoClassCalculationsDbSet.Add(autoClassCalculation);
            }
            request.ratingContext.SaveChangesWithChangeTracking(request.Identity);

            return recordCount;
        }

private static AutoClassCalculation CreateAutoClassCalculation(
    IEnumerable<AutoClassRoundingRule> autoClassRoundingRules, 
    AutoClassForm autoClassForm,
    BaseCalculation baseCalculation)
{
    var autoClassCalculation = new AutoClassCalculation()
    {   
        BaseCalculation = baseCalculation, 
        AutoClassForm = autoClassForm, 
        BaseCalculationId = baseCalculation.BaseCalculationId, 
        AutoClassFormId = autoClassForm.AutoClassFormId
    };

    var roundingRule = autoClassRoundingRules != null ? autoClassRoundingRules.FindMatchingAutoClassRoundingRule(autoClassForm.AutoClassId, autoClassCalculation.CalcRate) : new AutoClassRoundingRule();
    autoClassCalculation.CalculateRate(roundingRule);

    return autoClassCalculation;
}

1 个答案:

答案 0 :(得分:2)

我在您的代码中看到一个问题和一个潜在问题:


所有线程都直接访问recordCount变量。虽然num++可能看起来像原子操作,但事实并非如此。它基本上等同于num = num + 1。由于这是在多个CPU指令中执行的,因此线程可能会获取值,并在更新值之前被挂起。同时,其他线程会增加该值,并且一旦恢复初始线程,它就会根据旧的起始值放置它计算的值。您应该使用Interlocked.Increment()函数。

,而不是使用递增运算符
Interlocked.Increment(ref recordCount);

您的集合的枚举器可能不是线程安全的。如果您使用的是自定义集合类型,则对元素的并行访问可能会比您预期的更快地迭代它们。这不应该导致你描述的问题。明智的做法是使用BlockingCollection<T>