为什么在使用范围时我会看到某些尺寸地图的减速?

时间:2013-07-28 15:30:02

标签: performance map go

在我的计算机上,当我达到某些尺寸的地图时,我看到每秒读数下降,但它不会以线性方式降级。事实上,性能会立即下降,然后随着尺寸的增加而缓慢回升:

$ go run map.go 425984 1 425985
    273578 wps ::   18488800 rps
    227909 wps ::    1790311 rps

$ go run map.go 400000 10000 500000
    271355 wps ::   18060069 rps
    254804 wps ::   18404288 rps
    267067 wps ::   18673778 rps
    216442 wps ::    1984859 rps
    246724 wps ::    2461281 rps
    282316 wps ::    3634125 rps
    216615 wps ::    4989007 rps
    276769 wps ::    6972233 rps
    212019 wps ::    9756720 rps
    286027 wps ::   14488593 rps
    227073 wps ::   17309822 rps

我预计写入会偶尔减慢(因为底层数据结构已调整大小),但是对大小敏感的读​​取(以及一个数量级)使我感到惊讶。

以下是我用来测试此代码的代码:

package main

import (
    "bytes"
    "fmt"
    "math/rand"
    "os"
    "strconv"
    "time"
)

func main() {
    start, _ := strconv.ParseInt(os.Args[1], 10, 64)
    step, _ := strconv.ParseInt(os.Args[2], 10, 64)
    end, _ := strconv.ParseInt(os.Args[3], 10, 64)
    for n := start; n <= end; n += step {
        runNTimes(n)
    }
}

func randomString() string {
    var b bytes.Buffer

    for i := 0; i < 16; i++ {
        b.WriteByte(byte(0x61 + rand.Intn(26)))
    }

    return b.String()
}

func perSecond(end time.Time, start time.Time, n int64) float64 {
    return float64(n) / end.Sub(start).Seconds()
}

func runNTimes(n int64) {
    m := make(map[string]int64)

    startAdd := time.Now()
    for i := int64(0); i < n; i++ {
        m[randomString()]++
    }
    endAdd := time.Now()

    totalInMap := int64(0)
    startRead := time.Now()
    for _, v := range m {
        //get around unused variable error,
        //v should always be > 0
        if v != 0 {
            totalInMap++
        } 
    }
    endRead := time.Now()

    fmt.Printf("%10.0f wps :: %10.0f rps\n",
        perSecond(endAdd, startAdd, n),
        perSecond(endRead, startRead, totalInMap),
    )
}

1 个答案:

答案 0 :(得分:2)

您的代码本身并不衡量地图效果。您的代码测量执行随机数生成的奇怪组合(不保证是恒定时间操作),测量映射(不保证是恒定时间操作,并且不保证以与普通地图访问性能相关的任何可预测方式)和也许它甚至会测量干扰“停止世界”的垃圾收集。

  • 不要编写自己的工作台功能,使用package "testing"提供的功能,它会更好。例如,它永远不会依赖于样本大小== 1(就像你的代码错误一样)。
  • 此外,在测量时间之外生成所有测试键。
  • 然后,为了最大限度地减少GC效果,perform runtime.GC()
  • 现在最后使用B.StartTimer并执行测量的代码路径。

无论如何,无论你打算如何正确测量都不会太有用。地图代码是Go运行时的实现细节,可以随时更改。 AFAIK,目前的实施与Go 1中的完全不同。

最后:是的,调整良好的地图实现预计可能对许多内容敏感,包括其中的项目数量和/或大小和/或类型 - 即使架构和CPU步进和缓存大小也可以发挥作用在这方面的作用。