IOCP线程 - 澄清?

时间:2015-02-24 08:06:01

标签: c# async-await iocp

阅读this article后说明:

  

设备完成作业后(IO操作) - 它会通知CPU   通过中断。

     

...... ......

     

但是,只有“完成”状态   存在于操作系统级别;该进程必须具有自己的内存空间   收到通知

     

...... ......

     

由于库/ BCL使用标准P / Invoke   重叠的I / O系统,它已经注册了句柄   I / O完成端口(IOCP),它是线程池的一部分。

     

...... ......

     

因此,一个I / O线程池线程简单地借用来执行APC,   它通知任务它已完成。

我对大胆的部分感兴趣:

如果我理解正确,在IO操作完成后,必须通知执行IO操作的实际进程。

问题#1:

是否意味着它为每个已完成的IO操作抓取线程池线程?或者这是一个专门的线程数?

问题#2:

看着:

for (int i=0;i<1000;i++)
    {
      PingAsync_NOT_AWAITED(i); //notice not awaited !
    }

这是否意味着我将在这里同时运行1000个IOCP线程池线程(某种类型),一切都完成了?

4 个答案:

答案 0 :(得分:14)

  

是否意味着它为每个线程抓取 new 线程池线程   完成IO操作?或者它是专用的线程数   这个?

为每个I / O请求创建一个新线程,以达到目的,这将是非常低效的。相反,运行时以少量线程(具体数量取决于您的环境)开始,并根据需要添加和删除工作线程(对此的确切算法同样因您的环境而异)。 .NET的主要版本已经看到了这个实现的变化,但基本思想保持不变:运行时尽力创建和维护尽可能多的线程,以便有效地为所有I / O提供服务。在我的系统(Windows 8.1,.NET 4.5.2)上,一个全新的控制台应用程序在进入Main时只有3个线程,并且在请求实际工作之前这个数字不会增加。

  

这是否意味着我将同时拥有1000个IOCP线程池线程   所有人都在这里跑完了吗?

没有。当您发出I / O请求时,线程将在完成端口上等待以获取结果并调用已注册的任何回调来处理结果(通过BeginXXX方法或作为任务的继续)。如果您使用任务而不等待它,那么该任务就会在那里结束并且该线程将返回到线程池。

如果你做了等待怎么办? 1000个I / O请求的结果不会真正同时到达,因为中断并非全部同时到达,但是假设间隔比我们处理它们所需的时间短得多。在这种情况下,线程池将继续启动线程以处理结果,直到达到最大值,并且任何进一步的请求将最终在完成端口上排队。根据您的配置方式,这些线程可能需要一些时间才能启动。

考虑以下(特意糟糕)玩具计划:

static void Main(string[] args) {
    printThreadCounts();
    var buffer = new byte[1024];
    const int requestCount = 30;
    int pendingRequestCount = requestCount;
    for (int i = 0; i != requestCount; ++i) {
        var stream = new FileStream(
            @"C:\Windows\win.ini",
            FileMode.Open, FileAccess.Read, FileShare.ReadWrite, 
            buffer.Length, FileOptions.Asynchronous
        );
        stream.BeginRead(
            buffer, 0, buffer.Length,
            delegate {
                Interlocked.Decrement(ref pendingRequestCount);
                Thread.Sleep(Timeout.Infinite);
            }, null
        );
    }
    do {
        printThreadCounts();
        Thread.Sleep(1000);
    } while (Thread.VolatileRead(ref pendingRequestCount) != 0);
    Console.WriteLine(new String('=', 40));
    printThreadCounts();
}

private static void printThreadCounts() {
    int completionPortThreads, maxCompletionPortThreads;
    int workerThreads, maxWorkerThreads;
    ThreadPool.GetMaxThreads(out maxWorkerThreads, out maxCompletionPortThreads);
    ThreadPool.GetAvailableThreads(out workerThreads, out completionPortThreads);
    Console.WriteLine(
        "Worker threads: {0}, Completion port threads: {1}, Total threads: {2}", 
        maxWorkerThreads - workerThreads, 
        maxCompletionPortThreads - completionPortThreads, 
        Process.GetCurrentProcess().Threads.Count
    );
}

在我的系统(具有8个逻辑处理器)上,输出如下(结果可能因系统而异):

Worker threads: 0, Completion port threads: 0, Total threads: 3
Worker threads: 0, Completion port threads: 8, Total threads: 12
Worker threads: 0, Completion port threads: 9, Total threads: 13
Worker threads: 0, Completion port threads: 11, Total threads: 15
Worker threads: 0, Completion port threads: 13, Total threads: 17
Worker threads: 0, Completion port threads: 15, Total threads: 19
Worker threads: 0, Completion port threads: 17, Total threads: 21
Worker threads: 0, Completion port threads: 19, Total threads: 23
Worker threads: 0, Completion port threads: 21, Total threads: 25
Worker threads: 0, Completion port threads: 23, Total threads: 27
Worker threads: 0, Completion port threads: 25, Total threads: 29
Worker threads: 0, Completion port threads: 27, Total threads: 31
Worker threads: 0, Completion port threads: 29, Total threads: 33
========================================
Worker threads: 0, Completion port threads: 30, Total threads: 34

当我们发出30个异步请求时,线程池会快速使8个线程可用于处理结果,但之后它只会以每秒约2个的悠闲速度旋转新线程。这表明如果要正确利用系统资源,最好确保快速完成I / O处理。实际上,让我们将代理改为以下代表,代表请求的“正确”处理:

stream.BeginRead(
    buffer, 0, buffer.Length,
    ar => {
        stream.EndRead(ar);
        Interlocked.Decrement(ref pendingRequestCount);
    }, null
);

结果:

Worker threads: 0, Completion port threads: 0, Total threads: 3
Worker threads: 0, Completion port threads: 1, Total threads: 11
========================================
Worker threads: 0, Completion port threads: 0, Total threads: 11

同样,结果可能因系统和运行而异。在这里,我们几乎没有看到正在运行的完成端口线程,而我们发出的30个请求在没有启动新线程的情况下完成。您应该发现可以将“30”更改为“100”甚至“100000”:我们的循环无法比完成请求更快地启动请求。但请注意,结果偏向于我们的偏好,因为“I / O”反复读取相同的字节,并且将从操作系统缓存中提供服务,而不是从磁盘读取。这并不是为了展示实际的吞吐量,当然,只是开销的差异。

要使用工作线程而不是完成端口线程重复这些结果,只需将FileOptions.Asynchronous更改为FileOptions.None即可。这使文件访问同步,异步操作将在工作线程上完成,而不是使用完成端口:

Worker threads: 0, Completion port threads: 0, Total threads: 3
Worker threads: 8, Completion port threads: 0, Total threads: 15
Worker threads: 9, Completion port threads: 0, Total threads: 16
Worker threads: 10, Completion port threads: 0, Total threads: 17
Worker threads: 11, Completion port threads: 0, Total threads: 18
Worker threads: 12, Completion port threads: 0, Total threads: 19
Worker threads: 13, Completion port threads: 0, Total threads: 20
Worker threads: 14, Completion port threads: 0, Total threads: 21
Worker threads: 15, Completion port threads: 0, Total threads: 22
Worker threads: 16, Completion port threads: 0, Total threads: 23
Worker threads: 17, Completion port threads: 0, Total threads: 24
Worker threads: 18, Completion port threads: 0, Total threads: 25
Worker threads: 19, Completion port threads: 0, Total threads: 26
Worker threads: 20, Completion port threads: 0, Total threads: 27
Worker threads: 21, Completion port threads: 0, Total threads: 28
Worker threads: 22, Completion port threads: 0, Total threads: 29
Worker threads: 23, Completion port threads: 0, Total threads: 30
Worker threads: 24, Completion port threads: 0, Total threads: 31
Worker threads: 25, Completion port threads: 0, Total threads: 32
Worker threads: 26, Completion port threads: 0, Total threads: 33
Worker threads: 27, Completion port threads: 0, Total threads: 34
Worker threads: 28, Completion port threads: 0, Total threads: 35
Worker threads: 29, Completion port threads: 0, Total threads: 36
========================================
Worker threads: 30, Completion port threads: 0, Total threads: 37

线程池每秒旋转一个工作线程,而不是为完成端口线程启动的两个工作线程。显然,这些数字是依赖于实现的,并且可能会在新版本中发生变化。

最后,让我们演示使用ThreadPool.SetMinThreads来确保完成请求的最小线程数。如果我们返回FileOptions.Asynchronous并将ThreadPool.SetMinThreads(50, 50)添加到我们的玩具计划的Main,结果是:

Worker threads: 0, Completion port threads: 0, Total threads: 3
Worker threads: 0, Completion port threads: 31, Total threads: 35
========================================
Worker threads: 0, Completion port threads: 30, Total threads: 35

现在,线程池不是每两秒耐心地添加一个线程,而是继续旋转线程直到达到最大值(在这种情况下不会发生,因此最终计数保持在30)。当然,所有这30个线程都处于无限等待状态 - 但如果这是一个真正的系统,那么这30个线程现在可能会在非常有效的工作中发挥作用。不过,我不会尝试使用100000个请求

答案 1 :(得分:8)

这有点宽泛,所以我只想谈谈要点:

IOCP线程位于单独的线程池中,可以说是I / O线程设置。因此,它们不会与用户线程池线程发生冲突(就像您在普通await操作或ThreadPool.QueueWorkerItem中所拥有的那样)。

就像普通的线程池一样,它只会随着时间的推移慢慢分配新的线程。因此,即使同时发生异步响应的高峰,您也不会拥有1000个I / O线程。

在一个正确的异步应用程序中,你不会拥有超过内核数量,给予或接受,就像工作线程一样。这是因为您正在执行重要的CPU工作并且您将其发布在正常的工作线程上,或者您正在进行I / O工作,您应该将其作为异步操作。

这个想法是你在I / O回调中花费的时间很少 - 你不会阻止,而且你不会做很多CPU工作。如果你违反这个(比如,在你的回调中添加Thread.Sleep(10000)),那么是的,.NET将随着时间的推移创建大量的IO线程 - 但这只是不正确的使用。

现在,I / O线程与普通CPU线程有何不同?它们几乎是相同的,它们只是等待一个不同的信号 - 两者都是(简化警报)只是一个while循环一个方法,当一个新工作项被其他部分排队时控制应用程序(或操作系统)。主要区别在于I / O线程正在使用IOCP队列(OS托管),而普通工作线程有自己的队列,完全由.NET管理,可由应用程序员访问。

作为旁注,请不要忘记您的请求可能已同步完成。也许您在while循环中从TCP流中读取,一次512字节。如果套接字缓冲区中有足够的数据,则多个ReadAsync可以立即返回 而根本不进行任何线程切换。这通常不是问题,因为I / O往往是您在典型应用程序中执行的最耗时的工作,因此不必等待I / O通常很好。但是,根据某些部分异步发生的错误代码(即使不保证)可能很容易破坏您的应用程序。

答案 2 :(得分:5)

  

这是否意味着我将同时拥有1000个IOCP线程池线程   所有人都在这里跑完了吗?

不,一点也不。与ThreadPool中可用的工作线程相同,我们也有“完成端口线程”。

这些线程专用于异步I / O.不会预先创建线程。它们与工作线程一样按按需创建。当线程池决定时,它们最终会被销毁。

通过简单地借用作者意味着要通知IO进程的完成,使用来自“完成端口线程”(ThreadPool)的任意线程。它不会执行任何冗长的操作,而是完成IO通知。

答案 3 :(得分:2)

正如我们之前所说,IOCP和工作线程在线程池中有一个单独的资源。

如果您{IO}操作await,则无法注册IOCP或重叠IO。 await是一种更高级别的机制,与IOCP的注册无关。

通过简单的测试,您可以看到虽然没有await,但应用程序仍在使用IOCP:

private static void Main(string[] args)
{
    Task.Run(() =>
    {
        int count = 0;
        while (count < 30)
        {
            int _;
            int iocpThreads;
            ThreadPool.GetAvailableThreads(out _, out iocpThreads);
            Console.WriteLine("Current number of IOCP threads availiable: {0}", iocpThreads);
            count++;
            Thread.Sleep(10);
        }
    });

    for (int i = 0; i < 30; i++)
    {
        GetUrl(@"http://www.ynet.co.il");
    }

    Console.ReadKey();
}

private static async Task<string> GetUrl(string url)
{
    var httpClient = new HttpClient();
    var response = await httpClient.GetAsync(url);
    return await response.Content.ReadAsStringAsync();
}

根据执行每个请求所需的时间,您会在发出请求时看到IOCP缩小范围。您将尝试使用更少的线程的并发请求将可用于您。