惯用的goroutine终止和错误处理

时间:2016-11-25 16:51:04

标签: go channel goroutine

我有一个简单的并发用例,它让我疯狂,我无法找到一个优雅的解决方案。任何帮助将不胜感激。

我想编写一个方法fetchAll,它可以并行地从远程服务器查询未指定数量的资源。如果任何提取失败,我想立即返回第一个错误。

我最初的,天真的实现,泄漏了goroutines:

package main

import (
  "fmt"
  "math/rand"
  "sync"
  "time"
)

func fetchAll() error {
  wg := sync.WaitGroup{}
  errs := make(chan error)
  leaks := make(map[int]struct{})
  defer fmt.Println("these goroutines leaked:", leaks)

  // run all the http requests in parallel
  for i := 0; i < 4; i++ {
    leaks[i] = struct{}{}
    wg.Add(1)
    go func(i int) {
      defer wg.Done()
      defer delete(leaks, i)

      // pretend this does an http request and returns an error
      time.Sleep(time.Duration(rand.Intn(100)) * time.Millisecond)
      errs <- fmt.Errorf("goroutine %d's error returned", i)
    }(i)
  }

  // wait until all the fetches are done and close the error
  // channel so the loop below terminates
  go func() {
    wg.Wait()
    close(errs)
  }()

  // return the first error
  for err := range errs {
    if err != nil {
      return err
    }
  }

  return nil
}

func main() {
  fmt.Println(fetchAll())
}

游乐场:https://play.golang.org/p/Be93J514R5

我从阅读https://blog.golang.org/pipelines知道我可以创建一个信号通道来清理其他线程。或者,我可以使用context来完成它。但似乎这样一个简单的用例应该有一个我想要的更简单的解决方案。

5 个答案:

答案 0 :(得分:8)

除了你的一个goroutine外,其他所有人都被泄露了,因为他们还在等待发送到errs频道 - 你永远不会完成清空它的范围。你也正在泄漏goroutine,他的工作就是关闭errs通道,因为waitgroup从未完成。

(另外,正如Andy指出的那样,从地图中删除不是线程安全的,因此需要保护互斥锁。)

但是,我认为这里甚至不需要地图,互斥体,等待组,上下文等。我将重写整个事情只是使用基本的通道操作,如下所示:

package main

import (
    "fmt"
    "math/rand"
    "time"
)

func fetchAll() error {
    var N = 4
    quit := make(chan bool)
    errc := make(chan error)
    done := make(chan error)
    for i := 0; i < N; i++ {
        go func(i int) {
            // dummy fetch
            time.Sleep(time.Duration(rand.Intn(100)) * time.Millisecond)
            err := error(nil)
            if rand.Intn(2) == 0 {
                err = fmt.Errorf("goroutine %d's error returned", i)
            }
            ch := done // we'll send to done if nil error and to errc otherwise
            if err != nil {
                ch = errc
            }
            select {
            case ch <- err:
                return
            case <-quit:
                return
            }
        }(i)
    }
    count := 0
    for {
        select {
        case err := <-errc:
            close(quit)
            return err
        case <-done:
            count++
            if count == N {
                return nil // got all N signals, so there was no error
            }
        }
    }
}

func main() {
    rand.Seed(time.Now().UnixNano())
    fmt.Println(fetchAll())
}

游乐场链接:https://play.golang.org/p/mxGhSYYkOb

编辑:确实有一个愚蠢的错误,谢谢你指出来。我修改了上面的代码(我认为......)。我还添加了一些随机性来添加Realism™。

另外,我想强调的是,确实有多种方法可以解决这个问题,而我的解决方案只有一种方法。归根结底,它归结为个人品味,但总的来说,您希望努力实现“惯用”代码 - 并且采用自然且易于理解的风格。

答案 1 :(得分:4)

使用Error Group使其更加简单。这将自动等待所有提供的Go例程成功完成,或者在任何一个例程返回错误(在这种情况下该错误是返回给调用者的一个气泡)的情况下,取消所有剩余的Go例程。

package main

import (
        "context"
        "fmt"
        "math/rand"
        "time"

        "golang.org/x/sync/errgroup"
)

func fetchAll(ctx context.Context) error {
        errs, ctx := errgroup.WithContext(ctx)

        // run all the http requests in parallel
        for i := 0; i < 4; i++ {
                errs.Go(func() error {
                        // pretend this does an http request and returns an error                                                  
                        time.Sleep(time.Duration(rand.Intn(100)) * time.Millisecond)                                               
                        return fmt.Errorf("goroutine %d's error returned", i)                                                      
                })
        }

        // Wait for completion and return the first error (if any)                                                                 
        return errs.Wait()
}

func main() {
        fmt.Println(fetchAll(context.Background()))
}

答案 2 :(得分:0)

只要每个goroutine完成,你就不会泄漏任何东西。您应该创建缓冲的错误通道,缓冲区大小等于goroutines的数量,以便通道上的发送操作不会阻塞。无论是成功还是失败,每个goroutine都应该在通道完成时发送一些东西。然后底部的循环可以迭代goroutines的数量,如果它得到非零错误则返回。您不需要WaitGroup或其他关闭频道的goroutine。

我认为goroutines泄漏的原因是当你收到第一个错误时你会返回,所以其中一些仍在运行。

顺便说一句,地图不是安全的。如果您在goroutines之间共享地图并且其中一些正在对地图进行更改,则需要使用互斥锁保护它。

答案 3 :(得分:0)

这是errgroup建议的使用joth的更完整的示例。它显示处理成功的数据,并且将在第一个错误时退出。

https://play.golang.org/p/rU1v-Mp2ijo

package main

import (
    "context"
    "fmt"
    "golang.org/x/sync/errgroup"
    "math/rand"
    "time"
)

func fetchAll() error {
    g, ctx := errgroup.WithContext(context.Background())
    results := make(chan int)
    for i := 0; i < 4; i++ {
        current := i
        g.Go(func() error {
            // Simulate delay with random errors.
            time.Sleep(time.Duration(rand.Intn(100)) * time.Millisecond)
            if rand.Intn(2) == 0 {
                return fmt.Errorf("goroutine %d's error returned", current)
            }
            // Pass processed data to channel, or receive a context completion.
            select {
            case results <- current:
                return nil
            // Close out if another error occurs.
            case <-ctx.Done():
                return ctx.Err()
            }
        })
    }

    // Elegant way to close out the channel when the first error occurs or
    // when processing is successful.
    go func() {
        g.Wait()
        close(results)
    }()

    for result := range results {
        fmt.Println("processed", result)
    }

    // Wait for all fetches to complete.
    return g.Wait()
}

func main() {
    fmt.Println(fetchAll())
}

答案 4 :(得分:-1)

此答案包括将响应返回到 doneData -

package main

import (
    "fmt"
    "math/rand"
    "os"
    "strconv"
)

var doneData []string // responses

func fetchAll(n int, doneCh chan bool, errCh chan error) {
    partialDoneCh := make(chan string)

    for i := 0; i < n; i++ {
        go func(i int) {

            if r := rand.Intn(100); r != 0 && r%10 == 0 {
                // simulate an error
                errCh <- fmt.Errorf("e33or for reqno=" + strconv.Itoa(r))
            } else {
                partialDoneCh <- strconv.Itoa(i)
            }
        }(i)
    }

    // mutation of doneData
    for d := range partialDoneCh {
        doneData = append(doneData, d)
        if len(doneData) == n {
            close(partialDoneCh)
            doneCh <- true
        }
    }
}

func main() {
    // rand.Seed(1)
    var n int
    var e error
    if len(os.Args) > 1 {
        if n, e = strconv.Atoi(os.Args[1]); e != nil {
            panic(e)
        }
    } else {
        n = 5
    }

    doneCh := make(chan bool)
    errCh := make(chan error)

    go fetchAll(n, doneCh, errCh)
    fmt.Println("main: end")

    select {
    case <-doneCh:
        fmt.Println("success:", doneData)
    case e := <-errCh:
        fmt.Println("failure:", e, doneData)
    }
}
<块引用>

使用 go run filename.go 50 执行,其中 N=50,即并行量