如果我有一个结构:
type Foo struct {
title string
Tags map[string]string
}
如何保持一套独特的结构?根据我的理解,虽然结构相等是一件事 - 地图平等不是。这意味着我无法比较我的上述结构。因此,我不能只实施map as set pattern。
我能想到的两个可能有用的选项是:将标签转换为排序[][]string
或use reflect.Deepequal。任何人都有更好的主意吗?
答案 0 :(得分:2)
有几种方法可以实现这一点。 James Henstridge实际上有一个好主意,我试图实现它。如果没有我自己的哈希算法,它首先使用map就表现得非常糟糕。
我解决这个问题的方法就是保留一个结构数组,然后在插入时删除任何重复项。
package structset
type Foo struct {
title string
Tags map[string]string
}
func (f Foo) Equals(f2 Foo) bool {
if f.title != f2.title {
return false
}
if len(f.Tags) != len(f2.Tags) {
return false
}
for k, v := range f.Tags {
if w, ok := f2.Tags[k]; !ok || v != w {
return false
}
}
return true
}
type FooSet []Foo
func (this FooSet) Add(value Foo) {
if !this.Contains(value) {
this = append(this, value)
}
}
func (this FooSet) Length() int {
return len(this)
}
func (this FooSet) Contains(f Foo) bool {
for _, v := range this {
if v.Equals(f) {
return true
}
}
return false
}
func NewSet() FooSet {
return FooSet(make([]Foo, 0, 100))
}
我在i7-3770K Windows机器上对此进行了基准测试并得到了:
BenchmarkSmallSetWithFewCollisions 50000 46615 ns/op
BenchmarkSmallSetWithMoreCollisions 50000 46575 ns/op
BenchmarkSmallSetWithManyCollisions 50000 46605 ns/op
BenchmarkMediumSetWithFewCollisions 1000 2335296 ns/op
BenchmarkMediumSetWithMoreCollisions 1000 2352298 ns/op
BenchmarkMediumSetWithManyCollisions 1000 2336796 ns/op
BenchmarkLargeSetWithFewCollisions 50 46805944 ns/op
BenchmarkLargeSetWithMoreCollisions 50 47376016 ns/op
BenchmarkLargeSetWithManyCollisions 50 46815946 ns/op
要获得极少量的性能,您可以先将所有数据插入到数组中,然后删除所有重复数据。
删除重复代码为:
func (this FooSet) RemoveDuplicates() {
length := len(this) - 1
for i := 0; i < length; i++ {
for j := i + 1; j <= length; j++ {
if this[i].Equals(this[j]) {
this[j] = this[length]
this = this[0:length]
length--
j--
}
}
}
}
这方面的基准是:
BenchmarkSmallSetWithFewCollisions 50000 45245 ns/op
BenchmarkSmallSetWithMoreCollisions 50000 45615 ns/op
BenchmarkSmallSetWithManyCollisions 50000 45555 ns/op
BenchmarkMediumSetWithFewCollisions 1000 2294791 ns/op
BenchmarkMediumSetWithMoreCollisions 1000 2309293 ns/op
BenchmarkMediumSetWithManyCollisions 1000 2286290 ns/op
BenchmarkLargeSetWithFewCollisions 50 46235870 ns/op
BenchmarkLargeSetWithMoreCollisions 50 46515906 ns/op
BenchmarkLargeSetWithManyCollisions 50 45865824 ns/op
这是将Foo分配给地图[string] Foo的基准。
BenchmarkSmallSetWithFewCollisions 50000 65718 ns/op
BenchmarkSmallSetWithMoreCollisions 50000 64238 ns/op
BenchmarkSmallSetWithManyCollisions 50000 55016 ns/op
BenchmarkMediumSetWithFewCollisions 500 3429435 ns/op
BenchmarkMediumSetWithMoreCollisions 500 3117395 ns/op
BenchmarkMediumSetWithManyCollisions 1000 2826858 ns/op
BenchmarkLargeSetWithFewCollisions 20 82635495 ns/op
BenchmarkLargeSetWithMoreCollisions 20 85285830 ns/op
BenchmarkLargeSetWithManyCollisions 20 73659350 ns/op
在我看来,即使地图是可以清洗的,它仍然表现不佳。
答案 1 :(得分:1)
根据您的操作,一个选项可能是将结构存储为地图中的值而不是键。为此,您需要创建一些方法来从每个结构值生成唯一键。
这样的事可能有用:
// Doesn't have to be a string: just has to be suitable for use as a map key.
func (foo *Foo) key() string {
return key_string
}
fooSet := make(map[string] *Foo)
// Store a Foo
fooSet[x.key()] = x
// Check if x is in the set:
if fooSet[x.key()] != nil {
println("x is in the set")
}
这种效果如何取决于您为结构导出密钥的效率。
答案 2 :(得分:0)
你确定你的例子有效吗? 我相信你必须传递指向Add()方法的指针才能使你的代码工作。无论如何,这是我的实现:
package math
// types
type IntPoint struct {
X, Y int
}
// set implementation for small number of items
type IntPointSet struct {
slice []IntPoint
}
// functions
func (p1 IntPoint) Equals(p2 IntPoint) bool {
return (p1.X == p2.X) && (p1.Y == p2.Y)
}
func (set *IntPointSet) Add(p IntPoint) {
if ! set.Contains(p) {
set.slice = append(set.slice, p)
}
}
func (set IntPointSet) Contains(p IntPoint) bool {
for _, v := range set.slice {
if v.Equals(p) {
return true
}
}
return false
}
func (set IntPointSet) NumElements() int {
return len(set.slice)
}
func NewIntPointSet() IntPointSet {
return IntPointSet{(make([]IntPoint, 0, 10))}
}