为什么HTTP请求总是要花费整个超时时间?

时间:2019-12-13 15:42:06

标签: go concurrency

我正在制作_golang git bruteforcer。这有点奇怪,我想这与并发有关。 sync.WaitGroup

这是代码:https://dpaste.org/vO7y

package main

import { <snipped for brevity> }

// ReadFile : Reads File and returns it's contents
func ReadFile(fileName string) []string { <snipped for brevity> }

func joinString(strs ...string) string { <snipped for brevity> }

// MakeRequest : Makes requests concurrently
func MakeRequest(client *http.Client, url string, useragent string, ch chan<- string, wg *sync.WaitGroup) {
    defer wg.Done()
    // start := time.Now()
    request, err := http.NewRequest("GET", url, nil)
    if err != nil {
        fmt.Println(err)
        return
    }
    request.Header.Set("User-Agent", useragent)
    response, err := client.Do(request)
    if err != nil {
        return
    }
    // secs := time.Since(start).Seconds()
    if response.StatusCode < 400 {
        // fmt.Printf("Time elapsed %f", secs)
        bodyBytes, err := ioutil.ReadAll(response.Body)
        if err != nil {
            log.Fatal(err)
        }
        defer response.Body.Close()
        bodyString := string(bodyBytes)
        notGit, err := regexp.MatchString("<html>", strings.ToLower(bodyString))
        if !notGit && len(bodyString) > 0 { // empty pages and html pages shouldn't be included
            fmt.Println(bodyString)
            ch <- fmt.Sprintf(" %s ", Green(url))
        }
    }
}

func main() {
    start := time.Now()
    useragent := "Mozilla/10.0 (Windows NT 10.0) AppleWebKit/538.36 (KHTML, like Gecko) Chrome/69.420 Safari/537.36"
    gitEndpoint := []string{"/.git/", "/.git/HEAD", "/.gitignore", "/.git/description", "/.git/index"}
    timeout := 10 * time.Second
    var tr = &http.Transport{
        MaxIdleConns:      30,
        IdleConnTimeout:   time.Second,
        DisableKeepAlives: true,
        TLSClientConfig:   &tls.Config{InsecureSkipVerify: true},
        DialContext: (&net.Dialer{
            Timeout:   timeout,
            KeepAlive: time.Second,
        }).DialContext,
    }
    re := func(req *http.Request, via []*http.Request) error {
        return http.ErrUseLastResponse
    }
    client := &http.Client{
        Transport:     tr,
        CheckRedirect: re,
        Timeout:       timeout,
    }
    output := ReadFile(os.Args[1])
    // start := time.Now()
    ch := make(chan string)
    var wg sync.WaitGroup
    for _, url := range output {
        for _, endpoint := range gitEndpoint {
            wg.Add(1)
            go MakeRequest(client, "https://"+url+endpoint, useragent, ch, &wg)
        }
    }
    go func() {
        wg.Wait()
        close(ch)
    }()
    f, err := os.OpenFile("git_finder.txt", os.O_APPEND|os.O_CREATE|os.O_WRONLY, 0644)
    for val := range ch {
        if err != nil {
            fmt.Println(Red(err))
        }
        _, err = fmt.Fprintln(f, val)
        fmt.Println(val)
    }
    f.Close()
    fmt.Printf("Total time taken %.2fs elapsed\n", time.Since(start).Seconds())
}

工作中:

它从文件中读取网址,并在网络服务器上检查/.git, /.git/HEAD, /.git/description, /.git/index

问题: 如果将http.Client超时更改为2 seconds,它将在2秒内完成;如果是50秒,它将等待50秒,输入文件包含10个URL还是500个URL都没有关系。 我的理解是,如果有更多的url,它将等待直到goroutine传递的最后一个URL超时。

更新1:

正如评论中的adrian所提到的,它看起来并不像并发问题,这就是主要问题之一,就是我无法确切地了解这里的确切问题

1 个答案:

答案 0 :(得分:1)

在代码中,您正在从文件读取URL,然后与所有这些URL并行触发请求,然后等待所有并行请求完成。

因此,这实际上是有道理的,并不表示存在问题:

  

如果将http.Client超时更改为2秒,它将在2秒内完成;如果是50秒,它将等待到50秒,输入文件包含10个URL还是500个URL都没有关系。

假设您的文件有500个网址。

您并行触发500个请求...,然后等待所有请求完成(请记住,它们都是并行执行的)。那要花多长时间?

在最坏的情况下(所有请求超时均为50秒),总共只需要50秒(因为它们都并行等待那50秒)。

在最佳情况下(所有请求都成功完成且没有超时),应该花费几秒钟。

通常情况下,您可能会看到(在50秒处有一些超时),然后花费50秒(在最坏的情况下,您将等待这几个请求并行地等待那50秒)。