我有一个应用程序,每秒大约进行400次读取,每秒进行100次写入redis(托管在redislabs上)。该应用程序使用github.com/garyburd/redigo
包作为redis代理。
我有两个函数,它们是唯一用于读写的函数:
func getCachedVPAIDConfig(key string) chan *cachedVPAIDConfig {
c := make(chan *cachedVPAIDConfig)
go func() {
p := pool.Get()
defer p.Close()
switch p.Err() {
case nil:
item, err := redis.Bytes(p.Do("GET", key))
if err != nil {
c <- &cachedVPAIDConfig{nil, err}
return
}
c <- &cachedVPAIDConfig{item, nil}
default:
c <- &cachedVPAIDConfig{nil, p.Err()}
return
}
}()
return c
}
func setCachedVPAIDConfig(key string, j []byte) chan error {
c := make(chan error)
go func() {
p := pool.Get()
defer p.Close()
switch p.Err() {
case nil:
_, err := p.Do("SET", key, j)
if err != nil {
c <- err
return
}
c <- nil
default:
c <- p.Err()
return
}
}()
return c
}
如您所见,我使用推荐的连接池机制(http://godoc.org/github.com/garyburd/redigo/redis#Pool)。
我在每个http请求上调用这些函数,应用程序上的端点正在获取。问题是:一旦应用程序开始获取请求,它立即开始抛出错误
dial tcp 54.160.xxx.xx:yyyy: connect: cannot assign requested address
(54.160.xxx.xx:yyyy是redis主持人)
我在redis上看到,当这种情况开始发生时,只有大约600个连接,这听起来并不是很多。
我尝试使用MaxActive
的{{1}}设置,将其设置在1000到50K之间,但结果是一样的。
有什么想法吗?
修改
这是我的池初始化代码(在pool
中执行此操作):
func init
编辑2: 通过应用下面答案中建议的内容解决了问题!
池初始化的新代码:
pool = redis.Pool{
MaxActive: 1000, // note: I tried changing this to 50K, result the same
Dial: func() (redis.Conn, error) {
c, err := redis.Dial("tcp", redisHost)
if err != nil {
return nil, err
}
if _, err := c.Do("AUTH", redisPassword); err != nil {
c.Close()
return nil, err
}
return c, err
},
}
这个新的init使得get和set超时由内部redigo处理,所以我不再需要在getCachedVPAIDConfig和setCachedVPAIDConfig函数上返回一个通道。这就是他们现在的样子:
pool = redis.Pool{
MaxActive: 500,
MaxIdle: 500,
IdleTimeout: 5 * time.Second,
Dial: func() (redis.Conn, error) {
c, err := redis.DialTimeout("tcp", redisHost, 100*time.Millisecond, 100*time.Millisecond, 100*time.Millisecond)
if err != nil {
return nil, err
}
if _, err := c.Do("AUTH", redisPassword); err != nil {
c.Close()
return nil, err
}
return c, err
},
}
答案 0 :(得分:2)
您在发送频道后关闭连接,如果频道阻止您没有关闭连接,这将导致您看到的错误。所以不要只是推迟,明确关闭连接。
我不认为这是问题,但无论如何都是个好主意 - 设置与DialTimeout
的关联超时。
确保你有一个正确的TestOnBorrow
函数来摆脱死连接,特别是如果你有超时。如果连接空闲超过3秒(函数接收空闲时间作为参数),我通常会执行PING
尝试将MaxIdle
设置为更大的数字,我记得通过增加池中的参数来解决池的问题。