应用错误收集

设置

设置是一个Python负载均衡器，带有两个后端TCP服务器，只提供静态文本。我故意想测试TCP负载平衡，然后测试协议变成nodejs。这三台机器都是HTTP的虚拟主机，单线程，512MB Ram，1核心。 The Python script can be seen here和我的haproxy.cfg can be found here

原来HAProxy网站已经覆盖了这个区域（我忽略了它的错误）。答案基本上是很多低级优化。直接从HAProxy网站复制：

HAProxy涉及操作系统体系结构中常见的几种技术，以实现绝对最大性能：

单进程，事件驱动模型大大降低了上下文切换和内存使用的成本。可以在一毫秒内处理数百个任务，并且每个会话的内存使用量大约为几千字节，而Apache中消耗的内存 - 类似于每个进程的兆字节数量。
O(1)事件检查器允许它（Linux和FreeBSD）允许在成千上万的任何连接上即时检测任何事件。
< / LI>
单缓冲，尽可能在读取和写入之间不进行任何数据复制。这节省了大量CPU周期和有用的内存带宽。通常，瓶颈将是I/O和网络接口之间的CPU总线。在10 Gbps时，内存带宽也可能成为瓶颈。
使用splice()下的Linux系统调用可以进行零拷贝转发，从而导致从Linux 3.5开始的实际零拷贝。这允许小于3瓦的设备（例如Seagate Dockstar）在HTTP转发gigabit/s流量。
MRU内存分配器使用固定大小的内存池进行直接内存分配，有利于热缓存区域而不是冷缓存区域。这大大减少了创建新会话所需的时间。
工作因子，例如一次多个accept()，并且能够在多进程模式下运行时限制每次迭代accept()的数量，从而使负载均匀分布进程之间。
基于树的存储，大量使用我已经开发了几年的Elastic Binary树。这用于保持定时器的顺序，以保持命令的运行队列，管理循环和最少连接队列，只需O(log(N))费用。
优化HTTP标头分析：解析标头，动态解释，并优化解析以避免重新读取任何先前读取的内存区域。当使用不完整的头到达缓冲区的末尾时使用检查点，这样当读取更多数据时，解析不会从头开始。解析平均HTTP请求通常需要Pentium-M 1.7 GHz上的2微秒。
小心减少昂贵的系统调用次数。大多数工作默认在用户空间中完成，例如时间读取，缓冲区聚合，文件描述符启用/禁用。

HAProxy如何实现其速度？

设置

1 个答案: