我想开发一个软件来处理来自使用GoLang的多个tcp连接的请求,并在具有10Gb-nic的服务器上运行。
似乎性能不足以在单核上恢复/发送数据。所以我想实现该软件以在多个cpu核心上重新发送/发送数据。
然后我做了一个简单的测试服务器来检查GoLang是否可以在多个cpu核心上重新发送/发送数据。它启动多个(16)goroutines以在同一个侦听器上启动http服务器,并使用ab(Apache Benchmark)作为客户端。
服务器启动后,我看到只有一个线程调用EpollWait,但服务器启动了18个线程,当我开始使用16个并发进行测试时,服务器只占用一个核心。
所以问题:是否有任何方法可以启动多个线程来处理GoLang中多个tcp连接的数据recv / send。或者我是否应该调用syscall.EpollWait来制作网络框架,自己动手做?
服务器的测试代码:
package main
import (
"io"
"log"
"net"
"net/http"
"runtime"
)
type HandlerFunction struct{}
func (self HandlerFunction) ServeHTTP(w http.ResponseWriter, req *http.Request) {
data := "Hello"
//fmt.Printf("data_len=%d\n", len(data))
io.WriteString(w, string(data))
}
func RoutineFunction(hs *http.Server, l net.Listener) {
runtime.LockOSThread()
err := hs.Serve(l)
if err != nil {
log.Fatalf("serve fail, err=[%s]", err)
}
}
func main() {
runtime.GOMAXPROCS(16)
l, err := net.Listen("tcp", "0.0.0.0:12345")
if err != nil {
log.Fatalf("listen fail, err=[%s]", err)
}
for i := 0; i < 15; i++ {
hs := http.Server{}
hs.Handler = HandlerFunction{}
go RoutineFunction(&hs, l)
}
hs := http.Server{}
hs.Handler = HandlerFunction{}
RoutineFunction(&hs, l)
}
答案 0 :(得分:5)
不完全是。
Go运行时(从go1.5开始)使用单个网络轮询器。当您在服务器中完成实际工作时,这很少是瓶颈,运行goroutine的线程将保持忙碌状态。但是在某些情况下,无论是有足够的内核还是足够的吞吐量,Go运行时都会受到影响,特别是因为轮询器通常与执行IO的线程位于不同的NUMA节点中。
如果您需要以该比例运行,我目前建议将Go服务器限制为单个NUMA节点,并运行服务器的多个实例。
例外情况是,如果将套接字置于阻塞模式,则该套接字上的IO将绑定到单个OS线程。我没有对此方法进行任何吞吐量测试以查看是否有任何好处,但如果您同时使用相对较少的套接字,那么尝试就不会有什么坏处。