handMade字典怎么可能比.Net字典快?

时间:2015-01-25 16:20:15

标签: c# dictionary collections

回顾一个开源项目,我发现了一个有趣的数据结构:

// Represents a layer of "something" that covers the map
public class CellLayer<T> : IEnumerable<T>
{
    public readonly Size Size;
    public readonly TileShape Shape;
    public event Action<CPos> CellEntryChanged = null;

    readonly T[] entries;

    public CellLayer(Map map)
        : this(map.TileShape, new Size(map.MapSize.X, map.MapSize.Y)) { }

    public CellLayer(TileShape shape, Size size)
    {
        Size = size;
        Shape = shape;
        entries = new T[size.Width * size.Height];
    }

    public void CopyValuesFrom(CellLayer<T> anotherLayer)
    {
        if (Size != anotherLayer.Size || Shape != anotherLayer.Shape)
            throw new ArgumentException(
                "layers must have a matching size and shape.", "anotherLayer");
        if (CellEntryChanged != null)
            throw new InvalidOperationException(
                "Cannot copy values when there are listeners attached to the CellEntryChanged event.");
        Array.Copy(anotherLayer.entries, entries, entries.Length);
    }

    // Resolve an array index from cell coordinates
    int Index(CPos cell)
    {
        return Index(cell.ToMPos(Shape));
    }

    // Resolve an array index from map coordinates
    int Index(MPos uv)
    {
        return uv.V * Size.Width + uv.U;
    }

    /// <summary>Gets or sets the <see cref="OpenRA.CellLayer"/> using cell coordinates</summary>
    public T this[CPos cell]
    {
        get
        {
            return entries[Index(cell)];
        }

        set
        {
            entries[Index(cell)] = value;

            if (CellEntryChanged != null)
                CellEntryChanged(cell);
        }
    }

    /// <summary>Gets or sets the layer contents using raw map coordinates (not CPos!)</summary>
    public T this[MPos uv]
    {
        get
        {
            return entries[Index(uv)];
        }

        set
        {
            entries[Index(uv)] = value;

            if (CellEntryChanged != null)
                CellEntryChanged(uv.ToCPos(Shape));
        }
    }

    /// <summary>Clears the layer contents with a known value</summary>
    public void Clear(T clearValue)
    {
        for (var i = 0; i < entries.Length; i++)
            entries[i] = clearValue;
    }

    public IEnumerator<T> GetEnumerator()
    {
        return (IEnumerator<T>)entries.GetEnumerator();
    }

    IEnumerator IEnumerable.GetEnumerator()
    {
        return GetEnumerator();
    }
}

该结构表示类型为T的矩阵,在给定CPos(X,Y)结构的情况下,它返回该位置的T元素。以下是一个示例用法:

var dic = new CellLayer<CellInfo>(TileShape.Rectangle, new Size(1280,1280));
cellLayer[new CPos(0, 1)] = new CellInfo(0, new CPos(0, 1), false);

在内部,CellLayer类将给定的CPos转换为int,作为内部数组的索引。

通过从客户端角度看类的操作,我觉得它像一个字典,所以我替换了实现。经过几次运行时测试和微基准测试,结果发现使用字典比使用手工制作的CellLayer类要慢几十倍。这让我感到惊讶。以下是我做的测试:

    [Test]
    public void DictionaryTest()
    {
        var dic = new Dictionary<CPos, CellInfo>(1280 * 1280);

        var watch = Stopwatch.StartNew();

        for (int i = 0; i < 1280; i++)
            for (int u = 0; u < 1280; u++)
                dic[new CPos(i, u)] = new CellInfo(0, new CPos(i, u), false);

        Console.WriteLine(watch.ElapsedTicks);
    }

    [Test]
    public void CellLayerTest()
    {
        var dic = new CellLayer<CellInfo>(TileShape.Rectangle, new Size(1280,1280));

        var watch = Stopwatch.StartNew();

        for (int i = 0; i < 1280; i++)
            for (int u = 0; u < 1280; u++)
                dic[new CPos(i, u)] = new CellInfo(0, new CPos(i, u), false);

        Console.WriteLine(watch.ElapsedTicks);
    }

我认为.NET Collections尽可能优化。任何人都可以向我解释使用词典的速度是如何使用&#34;自定义词典&#34;?

由于

2 个答案:

答案 0 :(得分:3)

对于原始版本,您可以使用此公式

找到条目的位置
uv.V * Size.Width + uv.U

在字典中查找位置

  1. 计算CPos的哈希码。
  2. 使用模数运算hashcode % dictionarySize
  3. 在字典中查找存储桶
  4. 如果存储桶不为空,请将您拥有的CPO与该存储桶中的CPos进行比较。如果它们不匹配,则会发生二次哈希码冲突。移至下一个存储桶并重试步骤3.
  5. 如果你有一个主代码冲突,也就是说许多不同的CPos值具有相同的哈希代码,你的字典将会非常慢。

    如果您有唯一的哈希码,那么可能是模数运算会破坏性能。但你需要附上一个探查器(例如Redgate ANTS)来确定。

答案 1 :(得分:-1)

字典维护搜索/可检索的一组主题(通过哈希表,二叉树或类似的东西)。因此,每个Add()和每个[key]意味着一些搜索(往往相对&#34;慢&#34;)。

在您的情况下,如果存在从CPos到整数(也称为数组索引)的简单映射,则不会进行搜索,而是直接(快速)访问数组的单元格。

或者,更简单一点:基本上你将哈希表/二进制树与平面数组进行比较。

<小时/> 的修改

当然两个集合都相当快,并显示O(1)复杂性。但是,哈希表中的查找比数组索引操作更复杂。