有没有办法将任务并行库(TPL)与SQLDataReader一起使用?

时间:2010-06-22 20:06:58

标签: c# ado.net .net-4.0 task-parallel-library

我喜欢TPL中Parallel.For和Parallel.ForEach扩展方法的简单性。我想知道是否有办法利用类似的东西,甚至是稍微高级的任务。

下面是SqlDataReader的典型用法,我想知道是否可能,如果是这样,如何用TPL中的内容替换下面的while循环。因为读者无法提供固定数量的迭代,所以不能使用For扩展方法,这样就可以处理我将收集的任务。我希望有人可能已经解决了这个问题,然后在ADO.net上做了一些事情并且不做了。

using (SqlConnection conn = new SqlConnection("myConnString"))
using (SqlCommand comm = new SqlCommand("myQuery", conn))
{
    conn.Open();

    SqlDataReader reader = comm.ExecuteReader();

    if (reader.HasRows)
    {
        while (reader.Read())
        {
            // Do something with Reader
        }
    }
}

2 个答案:

答案 0 :(得分:24)

你将很难直接替换while循环。 SqlDataReader不是  一个线程安全的类,所以你不能直接从多个线程使用它。

话虽这么说,您可能处理您使用TPL阅读的数据。这里有几个选项。最简单的方法是创建适用于阅读器的IEnumerable<T>实现,并返回包含数据的类或结构。然后,您可以使用PLINQ或Parallel.ForEach语句并行处理数据:

public IEnumerable<MyDataClass> ReadData()
{
    using (SqlConnection conn = new SqlConnection("myConnString"))
    using (SqlCommand comm = new SqlCommand("myQuery", conn))
    {
        conn.Open();

        SqlDataReader reader = comm.ExecuteReader();

        if (reader.HasRows)
        {
            while (reader.Read())
            {
                yield return new MyDataClass(... data from reader ...);
            }
        }
    }
}

一旦拥有该方法,您可以通过PLINQ或TPL直接处理:

Parallel.ForEach(this.ReadData(), data =>
{
    // Use the data here...
});

或者:

this.ReadData().AsParallel().ForAll(data => 
{
    // Use the data here...
});

答案 1 :(得分:19)

你快到了。使用此签名包裹您在函数中发布的代码:

IEnumerable<IDataRecord> MyQuery()

然后将// Do something with Reader代码替换为:

yield return reader;

现在你有一些在单个线程中工作的东西。不幸的是,当您阅读查询结果时,它每次都返回对相同对象的引用,并且对象只是为每次迭代而改变自身。这意味着如果你尝试并行运行它会得到一些非常奇怪的结果,因为并行读取会改变不同线程中使用的对象。您需要使用代码将记录的副本发送到并行循环。

但是,在这一点上,我喜欢做的是跳过记录的额外副本并直接进入强类型类。更重要的是,我喜欢使用通用方法来实现它:

IEnumerable<T> GetData<T>(Func<IDataRecord, T> factory, string sql, Action<SqlParameterCollection> addParameters)
{
    using (var cn = new SqlConnection("My connection string"))
    using (var cmd = new SqlCommand(sql, cn))
    {
        addParameters(cmd.Parameters);

        cn.Open();
        using (var rdr = cmd.ExecuteReader())
        {
            while (rdr.Read())
            {
                yield return factory(rdr);
            }
        }
    }
}

假设您的工厂方法按预期创建副本,则此代码应该可以安全地在Parallel.ForEach循环中使用。调用该方法看起来像这样(假设一个Employee类具有名为“Create”的静态工厂方法):

var UnderPaid = GetData<Employee>(Employee.Create, 
       "SELECT * FROM Employee WHERE AnnualSalary <= @MinSalary", 
       p => {
           p.Add("@MinSalary", SqlDbType.Int).Value = 50000;
       });
Parallel.ForEach(UnderPaid, e => e.GiveRaise());

重要更新:
我对此代码的信心并不像以前那么自信。一个单独的线程仍然可以改变读者,而另一个线程正在进行复制。我可以锁定它,但我也担心另一个线程可以调用更新读取器后原始自己调用Read()但在它开始复制之前。因此,这里的关键部分包含整个while循环......此时,您又回到了单线程。我希望有一种方法可以修改此代码,以便在多线程场景中按预期工作,但需要更多的研究。