将几个[]字节连接在一起的最快方法是什么?

时间:2015-09-03 08:27:25

标签: performance optimization go concatenation slice

现在我使用下面的代码(如BenchmarkEncoder()中所示)并且速度很快,但我想知道是否有更快,更有效的方法。我使用GOMAXPROCS=1

进行基准测试
sudo -E nice -n -20 go test -bench . -benchmem -benchtime 3s

package blackbird

import (
    "testing"
    "encoding/hex"
    "log"
    "bytes"
    "encoding/json"
)

var (
    d1, d2, d3, d4, outBytes []byte
    toEncode [][]byte
)

func init() {
    var err interface{}
    d1, err = hex.DecodeString("6e5438fd9c3748868147d7a4f6d355dd")
    d2, err = hex.DecodeString("0740e2dfa4b049f2beeb29cc304bdb5f")
    d3, err = hex.DecodeString("ab6743272358467caff7d94c3cc58e8c")
    d4, err = hex.DecodeString("7411c080762a47f49e5183af12d87330e6d0df7dd63a44808db4e250cdea0a36182fce4a309842e49f4202eb90184dd5b621d67db4a04940a29e981a5aea59be")
    if err != nil {
        log.Fatal("hex decoding failed: %v", err)
    }
    toEncode = [][]byte{d1, d2, d3, d4}

}

func Encode(stuff [][]byte) []byte {
    return bytes.Join(stuff, nil)
}

func BenchmarkEncoderDirect(b *testing.B) {
    for i := 0; i < b.N; i++ {
        bytes.Join(toEncode, nil)
    }
}

func BenchmarkEncoder(b *testing.B) {
    for i := 0; i < b.N; i++ {
        Encode(toEncode)
    }
}

func BenchmarkJsonEncoder(b *testing.B) {
    for i := 0; i < b.N; i++ {
        outBytes, _ = json.Marshal(toEncode)

    }
}

将多个[]byte连接在一起的最快方法是什么?

2 个答案:

答案 0 :(得分:5)

bytes.Join()非常快,但它会在可附加的字节切片之间添加一些额外的工作来附加分隔符。即使分隔符为空或nil切片,也会这样做。

因此,如果您关心最佳性能(虽然它会略有改进),您可以执行bytes.Join()无需附加(空)分隔符的操作:分配足够大的字节切片,并复制每个切片使用内置的copy()函数进入结果。

Go Playground

上试试
func Join(s ...[]byte) []byte {
    n := 0
    for _, v := range s {
        n += len(v)
    }

    b, i := make([]byte, n), 0
    for _, v := range s {
        i += copy(b[i:], v)
    }
    return b
}

使用它:

concatenated := Join(d1, d2, d3, d4)

<强>改进:

如果您事先知道总大小(或者您可以比在切片上循环更快地计算它),请提供它,您可以避免在切片上循环以计算所需的大小:

func JoinSize(size int, s ...[]byte) []byte {
    b, i := make([]byte, size), 0
    for _, v := range s {
        i += copy(b[i:], v)
    }
    return b
}

在你的情况下使用它:

concatenated := JoinSize(48 + len(d4), d1, d2, d3, d4)

备注:

但是如果你最终的目标是将连接的字节切片写入io.Writer,那么性能方面最好不要连接它们,而是分别将它们写入它。

答案 1 :(得分:2)

总的来说,@ icza的答案是正确的。但是,对于您的特定用例,您可以分配一次并更有效地解码到该缓冲区:

Like this:

package main

import (
    "encoding/hex"
)

func main() {
    h1 := []byte("6e5438fd9c3748868147d7a4f6d355dd")
    h2 := []byte("0740e2dfa4b049f2beeb29cc304bdb5f")
    h3 := []byte("ab6743272358467caff7d94c3cc58e8c")
    h4 := []byte("7411c080762a47f49e5183af12d87330e6d0df7dd63a44808db4e250cdea0a36182fce4a309842e49f4202eb90184dd5b621d67db4a04940a29e981a5aea59be")

    tg := make([]byte, 16+16+16+(1024*1024)) // allocate enough space for the 3 IDs and a max 1MB of extra data

    hex.Decode(tg[:16], h1)
    hex.Decode(tg[16:32], h2)
    hex.Decode(tg[32:48], h3)
    l, _ := hex.Decode(tg[48:], h4)

    tg = tg[:48+l]
}

在该代码的末尾,tg保存3个ID加上可变长度的第4个数据块,经过解码,连续。