在我的一个项目中,有点像聚合器,我会从网络上解析供稿,播客等。
如果我使用顺序方法,考虑到大量资源,处理所有资源需要相当长的时间(因为网络问题和类似的东西);
foreach(feed in feeds)
{
read_from_web(feed)
parse(feed)
}
所以我想实现并发,并且无法决定我是否应该使用ThreadPools来处理工作线程,或者只是依靠TPL来对其进行排序。
ThreadPools肯定会为我提供工作线程的工作,我会得到我所期望的(在多核CPU环境中,其他核心也将被利用)。
但是我仍然想考虑TPL,因为它推荐的方法,但我有点担心它。首先,我知道TPL使用ThreadPools,但增加了额外的决策层。我主要关心的是单核环境存在的情况。如果我没错,TPL从一开始就用一个数量的工作线程开始,这些工作线程数等于可用的CPU核心数。我担心TPL会产生与我的IO绑定案例的顺序方法类似的结果。
因此对于IO绑定操作(在我的情况下从web读取资源),最好是使用ThreadPools来控制事物,还是更好地依赖于TPL? TPL也可以用于IO绑定场景吗?
更新:我主要担心的是 - 单核CPU 环境中的 TPL会像顺序方式一样,还是会提供并发性?我已经在阅读Parallel Programming with Microsoft .NET了book,但是找不到确切的答案。
注意:这是我之前的问题[Is it possible to use thread-concurrency and parallelism together?]的重新措辞,这句话的措辞错误。
答案 0 :(得分:103)
所以我决定为此编写测试并在实际数据上看到它。
测试图例
测试结果
单核CPU [Win7-32] - 在VMWare下运行 -
Test Environment: 1 physical cpus, 1 cores, 1 logical cpus.
Will be parsing a total of 10 feeds.
________________________________________________________________________________
Itr. Seq. PrlEx TPL TPool
________________________________________________________________________________
#1 10.82s 04.05s 02.69s 02.60s
#2 07.48s 03.18s 03.17s 02.91s
#3 07.66s 03.21s 01.90s 01.68s
#4 07.43s 01.65s 01.70s 01.76s
#5 07.81s 02.20s 01.75s 01.71s
#6 07.67s 03.25s 01.97s 01.63s
#7 08.14s 01.77s 01.72s 02.66s
#8 08.04s 03.01s 02.03s 01.75s
#9 08.80s 01.71s 01.67s 01.75s
#10 10.19s 02.23s 01.62s 01.74s
________________________________________________________________________________
Avg. 08.40s 02.63s 02.02s 02.02s
________________________________________________________________________________
单核CPU [WinXP] - 在VMWare下运行 -
Test Environment: 1 physical cpus, NotSupported cores, NotSupported logical cpus.
Will be parsing a total of 10 feeds.
________________________________________________________________________________
Itr. Seq. PrlEx TPL TPool
________________________________________________________________________________
#1 10.79s 04.05s 02.75s 02.13s
#2 07.53s 02.84s 02.08s 02.07s
#3 07.79s 03.74s 02.04s 02.07s
#4 08.28s 02.88s 02.73s 03.43s
#5 07.55s 02.59s 03.99s 03.19s
#6 07.50s 02.90s 02.83s 02.29s
#7 07.80s 04.32s 02.78s 02.67s
#8 07.65s 03.10s 02.07s 02.53s
#9 10.70s 02.61s 02.04s 02.10s
#10 08.98s 02.88s 02.09s 02.16s
________________________________________________________________________________
Avg. 08.46s 03.19s 02.54s 02.46s
________________________________________________________________________________
双核CPU [Win7-64]
Test Environment: 1 physical cpus, 2 cores, 2 logical cpus.
Will be parsing a total of 10 feeds.
________________________________________________________________________________
Itr. Seq. PrlEx TPL TPool
________________________________________________________________________________
#1 07.09s 02.28s 02.64s 01.79s
#2 06.04s 02.53s 01.96s 01.94s
#3 05.84s 02.18s 02.08s 02.34s
#4 06.00s 01.43s 01.69s 01.43s
#5 05.74s 01.61s 01.36s 01.49s
#6 05.92s 01.59s 01.73s 01.50s
#7 06.09s 01.44s 02.14s 02.37s
#8 06.37s 01.34s 01.46s 01.36s
#9 06.57s 01.30s 01.58s 01.67s
#10 06.06s 01.95s 02.88s 01.62s
________________________________________________________________________________
Avg. 06.17s 01.76s 01.95s 01.75s
________________________________________________________________________________
四核CPU [Win7-64] - 支持HyprerThreading -
Test Environment: 1 physical cpus, 4 cores, 8 logical cpus.
Will be parsing a total of 10 feeds.
________________________________________________________________________________
Itr. Seq. PrlEx TPL TPool
________________________________________________________________________________
#1 10.56s 02.03s 01.71s 01.69s
#2 07.42s 01.63s 01.71s 01.69s
#3 11.66s 01.69s 01.73s 01.61s
#4 07.52s 01.77s 01.63s 01.65s
#5 07.69s 02.32s 01.67s 01.62s
#6 07.31s 01.64s 01.53s 02.17s
#7 07.44s 02.56s 02.35s 02.31s
#8 08.36s 01.93s 01.73s 01.66s
#9 07.92s 02.15s 01.72s 01.65s
#10 07.60s 02.14s 01.68s 01.68s
________________________________________________________________________________
Avg. 08.35s 01.99s 01.75s 01.77s
________________________________________________________________________________
<强>综述强>
自行运行测试
您可以下载源here并自行运行。如果您可以发布结果,我也会添加它们。
更新:修复了源链接。
答案 1 :(得分:15)
如果您正在尝试最大化IO绑定任务的吞吐量,那么绝对 必须 将传统的异步处理模型(APM)API与基于TPL的工作相结合。在异步IO回调挂起时,APM API是解除CPU线程的唯一方法。 TPL提供the TaskFactory::FromAsync
helper method来帮助组合APM和TPL代码。
查看MSDN上名为TPL and Traditional .NET Asynchronous Programming的.NET SDK的这一部分,了解有关如何组合这两种编程模型以实现异步天堂的更多信息。
答案 2 :(得分:2)
你是对的,TPL确实删除了你创建自己的线程池时的一些控制。但这只有在你不想深入挖掘时才是正确的。 TPL允许您创建长时间运行的任务,这些任务不属于TPL线程池,可以很好地满足您的需求。出版的书籍是免费阅读Parallel Programming with Microsoft .NET,可以让您更深入地了解如何使用TPL。 您总是可以选择Paralle.For,Tasks explicit 参数应该分配多少个线程。除此之外,如果您想要完全控制,您可以将TPL调度程序替换为您自己的调度程序。
答案 3 :(得分:1)
您可以将自己的task scheduler分配给TPL任务。默认的work stealing非常聪明。
答案 4 :(得分:0)
我担心TPL会产生与我的IO绑定案例的顺序方法类似的结果。
我认为会的。瓶颈是什么?是解析还是下载?多线程对于从网上下载不会有太大帮助。
我会使用任务并行库进行裁剪,为下载的图像应用蒙版或效果,从播客中删除一些样本等。它更具可扩展性。
但它不会加速数量级。花费你的资源来实现一些功能,测试。
PS。 “哇,我的功能在0.7秒而不是0.9秒内发出;”
答案 5 :(得分:0)
如果您将对网址的调用并行化,我认为它会改善您的应用程序,即使只有一个核心。 看看这段代码:
var client = new HttpClient();
var urls = new[]{"a", "url", "to", "find"};
// due to the EAP pattern, this will run in parallel.
var tasks = urls.Select(c=> client.GetAsync(c));
var result = Tasks.WhenAll(task).ContinueWith(a=> AnalyzeThisWords(a.Result));
result.Wait(); // don't know if this is needed or it's correct to call wait
在这种情况下,多线程和异步之间的区别在于回调/完成的完成方式。
使用EAP时,任务数与线程数无关。
当您依赖GetAsync任务时,http客户端使用网络流(套接字,tcp客户端或其他)并在BeginRead / EndRead完成时发出信号以引发事件。所以,这一刻不涉及任何线程。
调用完成后,可能会创建一个新线程,但是由TaskScheduler(在调用GetAsync / ContinueWith调用中使用)创建一个新线程,使用现有线程或内联任务来使用调用线程。
如果AnalyzeThisWords
阻塞了太多时间,那么你就会开始遇到瓶颈,因为ContinueWith上的“回调”是从一个线程池工作者完成的。