附加到长度未知的大数组的最佳执行方式

时间:2019-03-02 08:25:56

标签: go

有几种方法可以附加到数组。想知道是否有已知的最佳执行方式来附加到未知长度的巨大阵列(100Mb)?我要避免复制,因为这样做会增加内存不足的机会,并且会降低性能。我应该考虑使用二维数组吗?

2 个答案:

答案 0 :(得分:2)

在Golang中,我们有数组和切片。


数组具有固定的大小,当需要更多空间时,需要创建更大的数组,然后从旧数组中复制所有值,并用新数组替换旧引用。

您不应保留对旧数组的引用,因此该内存将被垃圾回收。


或者,您可以使用切片(数组顶部的包装器)。调整大小和复制将自动为您完成。
您也可以手动控制调整大小,这样可以减少GC。但是应该对其进行剖析并与切片进行比较。

我添加了一个以多维数组存储的示例,我强烈建议避免这种方法。这将使遍历变得更复杂,更慢,出现内存泄漏的可能性更大,甚至更多。 Golang中的GC非常快。

BenchmarkStore/array-6            100000         20090 ns/op           0 B/op          0 allocs/op
BenchmarkStore/slice-6              5000        259940 ns/op     4654337 B/op         30 allocs/op
BenchmarkStore/Custom-6            10000        194152 ns/op     1747860 B/op          8 allocs/op
BenchmarkStore/Dimensions-6         3000        418654 ns/op     4458593 B/op         20 allocs/op
package main

import (
    "testing"
)

const size = 100000

// Wrapper around slice
type MyStore struct {
    growthFactor int
    watermark    int
    Data         []int
}

func NewMyStore(growthFactor, initialSize int) *MyStore {
    return &MyStore{growthFactor: growthFactor, watermark: -1, Data: make([]int, initialSize)}
}

func (s *MyStore) Append(v int) {
    nextPosition := s.watermark + 1
    currentSize := len(s.Data)
    full := currentSize == nextPosition
    if full {
        dataResize := make([]int, currentSize*s.growthFactor)
        copy(dataResize, s.Data)
        s.Data = dataResize
    }

    s.Data[nextPosition] = v
    s.watermark = nextPosition
}

// Dimensions
const chunkSize = 10
type MyStoreMultiDimensions struct {
    size      int
    watermark int
    data      [][chunkSize]int
}

func NewStoreMultiDimensions(chunks int) *MyStoreMultiDimensions {
    return &MyStoreMultiDimensions{watermark: -1, data: make([][chunkSize]int, chunks)}
}

func (s *MyStoreMultiDimensions) Append(v int) {
    nextPosition := s.watermark + 1
    chunk := nextPosition / chunkSize
    if len(s.data) <= chunk {
        s.data = append(s.data, [chunkSize]int{})
    }

    s.data[chunk][nextPosition%chunkSize] = v
    s.watermark = nextPosition
}

func BenchmarkStore(b *testing.B) {
    b.Run("array", func(b2 *testing.B) {
        for i := 0; i < b2.N; i++ {
            var store [size]int
            for item := 0; item < size; item++ {
                store[item] = item
            }
        }
    })
    b.Run("slice", func(b2 *testing.B) {
        for i := 0; i < b2.N; i++ {
            var store []int
            for item := 0; item < size; item++ {
                store = append(store, item)
            }
        }
    })
    b.Run("Custom", func(b2 *testing.B) {
        for i := 0; i < b2.N; i++ {
            var store = NewMyStore(4, 10)
            for item := 0; item < size; item++ {
                store.Append(item)
            }
        }
    })
    b.Run("Dimensions", func(b2 *testing.B) {
        for i := 0; i < b2.N; i++ {
            var store = NewStoreMultiDimensions(2)
            for item := 0; item < size; item++ {
                store.Append(item)
            }
        }
    })
}

答案 1 :(得分:-2)

据我说,您应该考虑使用ArrayList而不是array。然后,您可以使用ArrayList的add()追加新元素。