我有一个客户端正在向服务器发送(接收)数据。客户端的代码类似于:
conn, _ := net.Dial("tcp", "127.0.0.1:3456")
reader := bufio.NewReader(conn)
writer := bufio.NewWriter(conn)
for true {
writer.write(data)
reader.read()
}
现在,假设服务器崩溃,导致conn
出错。这意味着write
循环中的read
和for
方法不会执行任何操作,只返回error
。即使服务器在接下来的几秒钟内再次出现,客户端的for
循环代码也无法与服务器通信,因为conn
有问题。
我想要实现的目标是:让客户端在服务器重新启动时继续运行。为此,我采用以下方法:
func fixConnection(conn *net.Conn, reader **[]bufio.Reader, writer **[]bufio.Writer) net.Conn {
for true {
oneByte := make([] byte, 1, 1)
reader := bufio.NewReader(*conn)
_, err := reader.Read(oneByte)
if err != nil {
for true {
var tmpConn net.Conn
tmpConn, err = net.Dial("tcp", "127.0.0.1:3456")
if err == nil {
*conn = tmpConn
*reader = bufio.NewReader(*conn)
*writer = bufio.NewWriter(*conn)
}
time.Sleep(time.Millisecond * 100)
}
} else {
reader.UnreadByte()
time.Sleep(time.Millisecond * 500)
continue
}
}
}
然后我只在客户端添加一行:
conn, _ := net.Dial("tcp", "127.0.0.1:3456")
reader := bufio.NewReader(conn)
writer := bufio.NewWriter(conn)
// new line
go fixConnection(&conn, &reader, &writer)
for true {
writer.write(data)
reader.read()
}
我的方法至少存在一个问题:bufio
不是线程安全的,所以当fixConnection
改变读者(编写者)时可能会出现问题。有没有办法在操作读者/作者之前不使用sync.Mutex
来解决这个问题。
另外,有没有更好的方法来解决我上面提到的问题。即,当服务器重新启动时再次连接到服务器?请注意,服务器可以在任何时间点接受多个客户端的连接。
答案 0 :(得分:1)
也许只是检查错误,就像这样
func connect(addr string)(*bufio.Reader, *bufio.Writer, Error){
conn, err := net.Dial("tcp", addr) reader := bufio.NewReader(conn)
if err != nill{
return(nil, nil, err)
}
writer := bufio.NewWriter(conn)
reader := bufio.NewReader(conn)
return(reader, writer, nil)
}
for reader, writer, err := connect(adrr);;{
if err !=nil {
reader, writer, err = connect(adrr)
continue
}
_, err = writer.write(data)
err = reader.read()
}
答案 1 :(得分:0)
以这种方式:
package main
import (
"net"
"sync"
"time"
)
type ReconnectingWriter struct {
Dialer func() (net.Conn, error)
mu sync.RWMutex
conn net.Conn
}
func NewReconnectingWriter(dialer func() (net.Conn, error)) *ReconnectingWriter {
return &ReconnectingWriter{Dialer: dialer}
}
func (rw *ReconnectingWriter) getConn() (net.Conn, error) {
rw.mu.RLock()
conn := rw.conn
rw.mu.RUnlock()
if conn != nil {
return conn, nil
}
rw.mu.Lock()
defer rw.mu.Unlock()
var err error
if rw.conn == nil {
rw.conn, err = rw.Dialer()
}
return rw.conn, err
}
func (rw *ReconnectingWriter) closeConn() {
rw.mu.Lock()
defer rw.mu.Unlock()
if rw.conn != nil {
rw.conn.Close()
rw.conn = nil
}
}
func (rw *ReconnectingWriter) Write(b []byte) (int, error) {
for i := 0; ; i++ {
if i > 0 {
time.Sleep(time.Second) // replace this with exp backoff + jitter
}
// try to get a connection
conn, err := rw.getConn()
if err != nil {
continue
}
// try to write the data
n, err := conn.Write(b)
if err != nil {
rw.closeConn()
continue
}
return n, err
}
}
func main() {
rw := NewReconnectingWriter(func() (net.Conn, error) {
return net.Dial("tcp", "localhost:9000")
})
rw.Write([]byte("hello world"))
}
你不应该这样做,因为你最终会得到部分写作。如果这是一个http服务器,更好的解决方案是使用负载均衡器,因为它可以正确地重放整个请求。 (haproxy或特使是选择)