我正在开发一个使用同步apis和线程池的tcp服务器:
TcpListener listener;
void Serve(){
while(true){
var client = listener.AcceptTcpClient();
ThreadPool.QueueUserWorkItem(this.HandleConnection, client);
//Or alternatively new Thread(HandleConnection).Start(client)
}
}
假设我的目标是在资源使用率最低的情况下处理尽可能多的并发连接,这似乎很快就会受到可用线程数量的限制。我怀疑通过使用非阻塞任务apis,我将能够用更少的资源处理更多。
我最初的印象是:
async Task Serve(){
while(true){
var client = await listener.AcceptTcpClientAsync();
HandleConnectionAsync(client); //fire and forget?
}
}
但令我印象深刻的是,这可能会导致瓶颈。也许HandleConnectionAsync需要花费非常长的时间才能达到第一次等待,并且将阻止主接受循环继续进行。这只会使用一个线程,还是运行时会在多个线程上神奇地运行它看起来合适的东西?
有没有办法将这两种方法结合起来,这样我的服务器就会使用它所需的线程数来确定正在运行的任务的数量,但是它不会在IO操作上不必要地阻塞线程?
在这样的情况下,是否存在最大化吞吐量的惯用方法?
答案 0 :(得分:22)
我让Framework管理线程并且不会创建任何额外的线程,除非我可能需要进行性能分析测试。特别是,如果HandleConnectionAsync
内的调用主要是IO绑定的。
无论如何,如果你想在HandleConnectionAsync
的开头发布调用线程(调度程序),那么这是一个非常简单的解决方案。 您可以使用ThreadPool
从await Yield()
跳转新线程。如果您的服务器在初始线程上没有安装任何同步上下文的执行环境中运行,那么这是有效的(控制台应用程序,WCF服务),通常是TCP服务器的情况。
[已编辑] 以下说明了这一点(代码最初来自here)。注意,主while
循环不会显式创建任何线程:
using System;
using System.Collections.Generic;
using System.Net.Sockets;
using System.Text;
using System.Threading.Tasks;
class Program
{
object _lock = new Object(); // sync lock
List<Task> _connections = new List<Task>(); // pending connections
// The core server task
private async Task StartListener()
{
var tcpListener = TcpListener.Create(8000);
tcpListener.Start();
while (true)
{
var tcpClient = await tcpListener.AcceptTcpClientAsync();
Console.WriteLine("[Server] Client has connected");
var task = StartHandleConnectionAsync(tcpClient);
// if already faulted, re-throw any error on the calling context
if (task.IsFaulted)
task.Wait();
}
}
// Register and handle the connection
private async Task StartHandleConnectionAsync(TcpClient tcpClient)
{
// start the new connection task
var connectionTask = HandleConnectionAsync(tcpClient);
// add it to the list of pending task
lock (_lock)
_connections.Add(connectionTask);
// catch all errors of HandleConnectionAsync
try
{
await connectionTask;
// we may be on another thread after "await"
}
catch (Exception ex)
{
// log the error
Console.WriteLine(ex.ToString());
}
finally
{
// remove pending task
lock (_lock)
_connections.Remove(connectionTask);
}
}
// Handle new connection
private async Task HandleConnectionAsync(TcpClient tcpClient)
{
await Task.Yield();
// continue asynchronously on another threads
using (var networkStream = tcpClient.GetStream())
{
var buffer = new byte[4096];
Console.WriteLine("[Server] Reading from client");
var byteCount = await networkStream.ReadAsync(buffer, 0, buffer.Length);
var request = Encoding.UTF8.GetString(buffer, 0, byteCount);
Console.WriteLine("[Server] Client wrote {0}", request);
var serverResponseBytes = Encoding.UTF8.GetBytes("Hello from server");
await networkStream.WriteAsync(serverResponseBytes, 0, serverResponseBytes.Length);
Console.WriteLine("[Server] Response has been written");
}
}
// The entry point of the console app
static void Main(string[] args)
{
Console.WriteLine("Hit Ctrl-C to exit.");
new Program().StartListener().Wait();
}
}
或者,代码可能如下所示,没有await Task.Yield()
。请注意,我将 async
lambda传递给Task.Run
,因为我仍然希望从HandleConnectionAsync
中的异步API中受益,并使用{ {1}}在那里:
await
[更新] 根据评论:如果这将是一个库代码,那么执行环境确实是未知的,并且可能具有非默认的同步上下文。在这种情况下,我宁愿在池线程上运行主服务器循环(没有任何同步上下文):
// Handle new connection
private static Task HandleConnectionAsync(TcpClient tcpClient)
{
return Task.Run(async () =>
{
using (var networkStream = tcpClient.GetStream())
{
var buffer = new byte[4096];
Console.WriteLine("[Server] Reading from client");
var byteCount = await networkStream.ReadAsync(buffer, 0, buffer.Length);
var request = Encoding.UTF8.GetString(buffer, 0, byteCount);
Console.WriteLine("[Server] Client wrote {0}", request);
var serverResponseBytes = Encoding.UTF8.GetBytes("Hello from server");
await networkStream.WriteAsync(serverResponseBytes, 0, serverResponseBytes.Length);
Console.WriteLine("[Server] Response has been written");
}
});
}
这样,private static Task StartListener()
{
return Task.Run(async () =>
{
var tcpListener = TcpListener.Create(8000);
tcpListener.Start();
while (true)
{
var tcpClient = await tcpListener.AcceptTcpClientAsync();
Console.WriteLine("[Server] Client has connected");
var task = StartHandleConnectionAsync(tcpClient);
// if already faulted, re-throw any error on the calling context
if (task.IsFaulted)
task.Wait();
}
});
}
内创建的所有子任务都不会受到客户端代码的同步上下文的影响。所以,我不必在任何地方明确地调用StartListener
。
答案 1 :(得分:8)
现有答案已正确建议使用Task.Run(() => HandleConnection(client));
,但未解释原因。
原因如下:您担心HandleConnectionAsync
可能需要一些时间才能完成第一次等待。如果您坚持使用异步IO(在这种情况下应该如此),这意味着HandleConnectionAsync
正在进行CPU绑定工作而没有任何阻塞。这是线程池的完美案例。它可以运行简短,无阻塞的CPU工作。
你是对的,接受循环会被HandleConnectionAsync
限制在返回之前需要很长时间(可能是因为其中存在大量的CPU绑定工作)。如果您需要高频率的新连接,则应避免这种情况。
如果您确定没有重要的工作限制循环,您可以保存额外的线程池Task
而不是这样做。
或者,您可以同时运行多个接受。将await Serve();
替换为(例如):
var serverTasks =
Enumerable.Range(0, Environment.ProcessorCount)
.Select(_ => Serve());
await Task.WhenAll(serverTasks);
这消除了可伸缩性问题。 Note, that await
will swallow all but one error here.
答案 2 :(得分:1)
尝试
TcpListener listener;
void Serve(){
while(true){
var client = listener.AcceptTcpClient();
Task.Run(() => this.HandleConnection(client));
//Or alternatively new Thread(HandleConnection).Start(client)
}
}
答案 3 :(得分:1)
根据Microsoft http://msdn.microsoft.com/en-AU/library/hh524395.aspx#BKMK_VoidReturnType,不应使用void返回类型,因为它无法捕获异常。正如你所指出的,你确实需要&#34;开火,忘记&#34;任务,所以我的结论是你必须总是返回Task(正如微软所说),但是你应该使用以下方法来捕获错误:
TaskInstance.ContinueWith(i => { /* exception handler */ }, TaskContinuationOptions.OnlyOnFaulted);
我用作证据的例子如下:
public static void Main()
{
Awaitable()
.ContinueWith(
i =>
{
foreach (var exception in i.Exception.InnerExceptions)
{
Console.WriteLine(exception.Message);
}
},
TaskContinuationOptions.OnlyOnFaulted);
Console.WriteLine("This needs to come out before my exception");
Console.ReadLine();
}
public static async Task Awaitable()
{
await Task.Delay(3000);
throw new Exception("Hey I can catch these pesky things");
}
答案 4 :(得分:0)
您是否有任何理由需要接受异步连接?我的意思是,等待任何客户端连接是否给你任何价值?这样做的唯一原因是因为在等待连接时服务器中还有其他工作正在进行。如果有,你可能会做这样的事情:
public async void Serve()
{
while (true)
{
var client = await _listener.AcceptTcpClientAsync();
Task.Factory.StartNew(() => HandleClient(client), TaskCreationOptions.LongRunning);
}
}
这样接受将释放当前线程离开选项以完成其他事情,并且处理在新线程上运行。唯一的开销是产生一个新线程来处理客户端,然后再直接回到接受新连接。
编辑: 刚刚意识到它与您编写的代码几乎相同。我想我需要再次阅读你的问题,以便更好地理解你的实际问题:S
EDIT2:
有没有办法将这两种方法结合起来,以便我的服务器可以完全使用 它对于正在运行的任务的数量所需的线程数,但它会这样 不会在IO操作上不必要地阻塞线程?
认为我的解决方案实际上回答了这个问题。它真的有必要吗?
EDIT3: Made Task.Factory.StartNew()实际上创建了一个新线程。