修复Go中的错误连接

时间:2018-04-25 11:57:06

标签: go server client

我有一个客户端正在向服务器发送(接收)数据。客户端的代码类似于:

conn, _ := net.Dial("tcp", "127.0.0.1:3456")
reader := bufio.NewReader(conn)
writer := bufio.NewWriter(conn)

for true {
   writer.write(data)
   reader.read()
}

现在,假设服务器崩溃,导致conn出错。这意味着write循环中的readfor方法不会执行任何操作,只返回error。即使服务器在接下来的几秒钟内再次出现,客户端的for循环代码也无法与服务器通信,因为conn有问题。

我想要实现的目标是:让客户端在服务器重新启动时继续运行。为此,我采用以下方法:

    func fixConnection(conn *net.Conn, reader **[]bufio.Reader, writer **[]bufio.Writer) net.Conn {

        for true {

            oneByte := make([] byte, 1, 1)
            reader := bufio.NewReader(*conn)
            _, err := reader.Read(oneByte)
            if err != nil {
                for true {
                    var tmpConn net.Conn
                    tmpConn, err = net.Dial("tcp", "127.0.0.1:3456")
                    if err == nil {
                        *conn = tmpConn
                        *reader = bufio.NewReader(*conn)
                        *writer = bufio.NewWriter(*conn)
                    }
                    time.Sleep(time.Millisecond * 100)
                }
            } else {
                reader.UnreadByte()
                time.Sleep(time.Millisecond * 500)
                continue
            }

        }
}

然后我只在客户端添加一行:

conn, _ := net.Dial("tcp", "127.0.0.1:3456")
reader := bufio.NewReader(conn)
writer := bufio.NewWriter(conn)

// new line
go fixConnection(&conn, &reader, &writer)

for true {
   writer.write(data)
   reader.read()
}

我的方法至少存在一个问题:bufio不是线程安全的,所以当fixConnection改变读者(编写者)时可能会出现问题。有没有办法在操作读者/作者之前不使用sync.Mutex来解决这个问题。

另外,有没有更好的方法来解决我上面提到的问题。即,当服务器重新启动时再次连接到服务器?请注意,服务器可以在任何时间点接受多个客户端的连接。

2 个答案:

答案 0 :(得分:1)

也许只是检查错误,就像这样

func connect(addr string)(*bufio.Reader, *bufio.Writer, Error){
    conn, err := net.Dial("tcp", addr)  reader := bufio.NewReader(conn)
    if err != nill{
        return(nil, nil, err)
    }
    writer := bufio.NewWriter(conn)
    reader := bufio.NewReader(conn)
    return(reader, writer, nil)
}
for reader, writer, err := connect(adrr);;{
    if err !=nil {
        reader, writer, err = connect(adrr)
        continue
    }
    _, err = writer.write(data)
    err = reader.read()
}

答案 1 :(得分:0)

以这种方式:

package main

import (
    "net"
    "sync"
    "time"
)

type ReconnectingWriter struct {
    Dialer func() (net.Conn, error)

    mu   sync.RWMutex
    conn net.Conn
}

func NewReconnectingWriter(dialer func() (net.Conn, error)) *ReconnectingWriter {
    return &ReconnectingWriter{Dialer: dialer}
}

func (rw *ReconnectingWriter) getConn() (net.Conn, error) {
    rw.mu.RLock()
    conn := rw.conn
    rw.mu.RUnlock()

    if conn != nil {
        return conn, nil
    }

    rw.mu.Lock()
    defer rw.mu.Unlock()

    var err error
    if rw.conn == nil {
        rw.conn, err = rw.Dialer()
    }

    return rw.conn, err
}

func (rw *ReconnectingWriter) closeConn() {
    rw.mu.Lock()
    defer rw.mu.Unlock()

    if rw.conn != nil {
        rw.conn.Close()
        rw.conn = nil
    }
}

func (rw *ReconnectingWriter) Write(b []byte) (int, error) {
    for i := 0; ; i++ {
        if i > 0 {
            time.Sleep(time.Second) // replace this with exp backoff + jitter
        }

        // try to get a connection
        conn, err := rw.getConn()
        if err != nil {
            continue
        }

        // try to write the data
        n, err := conn.Write(b)
        if err != nil {
            rw.closeConn()
            continue
        }

        return n, err
    }
}

func main() {
    rw := NewReconnectingWriter(func() (net.Conn, error) {
        return net.Dial("tcp", "localhost:9000")
    })
    rw.Write([]byte("hello world"))
}

你不应该这样做,因为你最终会得到部分写作。如果这是一个http服务器,更好的解决方案是使用负载均衡器,因为它可以正确地重放整个请求。 (haproxy或特使是选择)