我在为每个循环停止并行时遇到问题。
我正在迭代一组从表中检索到的大约40.000个DataRows,当我在结果集中有100个项目时,我需要立即停止循环。问题是当我在ParallelLoopState上触发Stop方法时,迭代不会立即停止,导致我的结果集不一致(无论是少数项还是多项)。
有没有办法确定,一旦我点击停止,我就会杀死所有线程?
List<DataRow> rows = new List<DataRow>(dataTable.Select());
ConcurrentDictionary<string, object> resultSet = new ConcurrentDictionary<string, object>();
rows.EachParallel(delegate (DataRow row, ParallelLoopState state)
{
if (!state.IsStopped)
{
using (SqlConnection sqlConnection = new SqlConnection(Global.ConnStr))
{
sqlConnection.Open();
//{
// Do some processing.......
//}
var sourceKey = "key retrieved from processing";
if (!resultSet.ContainsKey(sourceKey))
{
object myCustomObj = new object();
resultSet.AddOrUpdate(
sourceKey,
myCustomObj,
(key, oldValue) => myCustomObj);
}
if (resultSet.Values.Count == 100)
state.Stop();
}
}
});
答案 0 :(得分:6)
ParallelLoopState.Stop的文档页面解释了调用Stop()
将阻止新的迭代启动。它不会中止任何现有的迭代。
Stop()
还将IsStopped属性设置为true
。长时间运行的迭代可以检查IsStopped
的值,并在需要时提前退出。
这称为协作取消,远比中止线程好。中止线程很昂贵并且难以清理。想象一下,如果在您想要提交工作时抛出ThreadAbort
异常会发生什么。
另一方面,合作取消允许任务在必要时提交或中止事务,关闭连接,清理其他状态和文件等后正常退出。
此外,Parallel
使用任务而不是线程来处理数据块。其中一个线程是启动并行操作的原始线程。中止不仅会浪费线程池线程,还会杀死主线程。
这不一个错误 - Parallel
旨在解决数据并行问题,而不是异步执行。在这种情况下,需要系统使用尽可能多的任务来处理数据,并在处理完成后继续。