答案 0 :(得分:9)
Power Collections确实提供了.NET框架中尚未存在的常用数据结构的一些优秀实现。虽然选择这个选项并不可怕,但我想用这种方法指出一个重要的缺陷。
OrderedMultiDictionary(以及所有其他Power Collection类)使用红黑树来创建有序的键值对包。对于优先级队列,RB树往往是较差的数据结构。我假设优先级值可以整理为整数。
原因很简单 - 字典可以在O(1)中立即跳转到特定的优先级值,其中可以使用专门的数据结构来存储该优先级的值(即队列)。
为了检查我的说法,我写了一个简单的基准测试,根据3个不同的想法比较优先级队列结构:
第二个选项使用SortedDictionary,内部实现为BST。第三个选项使用带有O(1)查找的简单字典。
我测试了不同数量的元素,如Y轴所示,以及不同数量的不同值,如X轴所示。特定组合的结果显示为3×3的值矩阵。第一行是引用选项1(OrdererdMultiDictionary,第二行是SortedDictionary,第三行是字典。这3行中每一行的第一个值表示排队各自值的时间,第二行表示枚举所需的时间。在所有值上,第三个是再次出列所有值的时间。
所有时间都是log 2 。值10表示2 ^ 10ms = 1s,但绝对值不重要。元素的数量加倍,这意味着,如果结构表现为类似O(n),则每次时间应增加1。
水平地,不同值的数量乘以每列32。因此,第一列(反复插入相同的值)显示了保存值的内部数据结构的性能。
使用的机器是带有16 GB加SSD的i7。
| 1 | 32 | 1024 | 32768 | 1048576 |
128
| -4.9 / -4.3 / n/a | -4.7 / -4.1 / n/a | -4.8 / -2.9 / n/a | -4.9 / -2.9 / n/a | -4.9 / -2.9 / n/a |
| -7.5 / -6.1 / -5.3 | -6.5 / -5.7 / -5.1 | -4.7 / -4.9 / -4.3 | -4.6 / -4.7 / -4.2 | -4.6 / -4.8 / -4.2 |
| -7.5 / -7.6 / -6.6 | -6.8 / -7.3 / -6.3 | -5.9 / -5.9 / -3.0 | -6.2 / -6.4 / -2.8 | -6.2 / -6.3 / -2.8 |
256
| -3.8 / -3.2 / n/a | -3.7 / -3.1 / n/a | -3.7 / -2.2 / n/a | -3.8 / -1.8 / n/a | -3.7 / -1.8 / n/a |
| -6.8 / -5.5 / -4.4 | -5.8 / -5.4 / -4.2 | -3.8 / -4.3 / -3.4 | -3.5 / -4.1 / -3.2 | -3.5 / -4.1 / -3.1 |
| -6.6 / -6.9 / -5.7 | -6.1 / -6.7 / -5.7 | -5.5 / -5.3 / -1.8 | -5.3 / -5.0 / -0.9 | -5.3 / -5.6 / -1.0 |
512
| -2.7 / -2.1 / n/a | -2.5 / -2.1 / n/a | -2.5 / -1.5 / n/a | -2.6 / -0.7 / n/a | -2.6 / -0.7 / n/a |
| -5.9 / -5.2 / -3.4 | -4.9 / -5.0 / -3.3 | -3.2 / -4.2 / -2.6 | -2.4 / -3.2 / -2.1 | -2.3 / -3.2 / -2.0 |
| -5.7 / -6.1 / -4.9 | -5.2 / -6.1 / -4.8 | -4.8 / -5.0 / -1.7 | -4.3 / -4.0 / 1.0 | -4.4 / -4.7 / 1.0 |
1024
| -1.6 / -1.0 / n/a | -1.4 / -1.0 / n/a | -1.4 / -0.7 / n/a | -1.5 / 0.4 / n/a | -1.5 / 0.3 / n/a |
| -4.9 / -4.7 / -2.4 | -4.1 / -4.5 / -2.3 | -2.6 / -4.0 / -1.8 | -1.2 / -2.3 / -1.0 | -1.2 / -2.3 / -0.9 |
| -4.7 / -5.4 / -3.9 | -4.4 / -5.3 / -3.8 | -4.1 / -4.6 / -1.6 | -3.3 / -3.0 / 2.9 | -3.5 / -3.8 / 3.0 |
2048
| -0.4 / 0.1 / n/a | -0.3 / 0.1 / n/a | -0.3 / 0.3 / n/a | -0.3 / 1.5 / n/a | -0.5 / 1.4 / n/a |
| -4.0 / -4.1 / -1.4 | -3.2 / -4.0 / -1.3 | -1.7 / -3.5 / -0.9 | -0.2 / -1.4 / 0.1 | -0.2 / -1.3 / 0.1 |
| -3.8 / -4.5 / -2.9 | -3.5 / -4.4 / -2.9 | -3.2 / -3.9 / -1.0 | -2.5 / -2.0 / 4.9 | -2.4 / -2.1 / 4.9 |
4096
| 0.7 / 1.2 / n/a | 0.8 / 1.2 / n/a | 0.9 / 1.3 / n/a | 0.8 / 2.8 / n/a | 0.6 / 2.9 / n/a |
| -3.0 / -3.2 / -0.4 | -2.2 / -3.3 / -0.3 | -0.8 / -3.0 / 0.1 | 0.9 / -0.4 / 1.1 | 0.9 / -0.2 / 1.2 |
| -2.9 / -3.5 / -1.9 | -2.6 / -3.5 / -1.9 | -2.3 / -3.2 / -0.9 | -1.6 / -1.1 / 6.6 | -1.3 / -1.1 / 6.9 |
8192
| 1.8 / 2.8 / n/a | 1.9 / 3.0 / n/a | 2.0 / 3.0 / n/a | 1.9 / 4.0 / n/a | 1.8 / 4.1 / n/a |
| -2.0 / -2.4 / 0.6 | -1.3 / -2.4 / 0.7 | 0.1 / -2.2 / 1.1 | 1.8 / 0.4 / 2.1 | 2.1 / 0.9 / 2.3 |
| -1.9 / -2.6 / -1.0 | -1.6 / -2.5 / -0.9 | -1.4 / -2.4 / -0.3 | -0.6 / -0.3 / 8.0 | -0.5 / 0.1 / 8.9 |
16384
| 2.9 / 3.7 / n/a | 3.0 / 3.6 / n/a | 3.1 / 3.8 / n/a | 3.1 / 4.6 / n/a | 3.0 / 5.2 / n/a |
| -1.0 / -1.5 / 1.6 | -0.3 / -1.5 / 1.7 | 1.1 / -1.4 / 2.0 | 2.4 / 0.7 / 2.9 | 3.2 / 1.9 / 3.6 |
| -0.9 / -1.6 / 0.0 | -0.6 / -1.6 / 0.1 | -0.5 / -1.5 / 0.4 | 0.0 / -0.1 / 8.0 | 0.6 / 1.2 / 10.9 |
32768
| 4.0 / 5.0 / n/a | 4.1 / 5.0 / n/a | 4.3 / 5.0 / n/a | 4.2 / 5.5 / n/a | 4.1 / 6.4 / n/a |
| -0.1 / -0.5 / 2.6 | 0.7 / -0.5 / 2.7 | 2.0 / -0.5 / 3.1 | 3.1 / 0.9 / 3.8 | 4.3 / 3.0 / 4.8 |
| 0.1 / -0.6 / 1.0 | 0.4 / -0.6 / 1.1 | 0.5 / -0.5 / 1.3 | 0.9 / 0.4 / 8.0 | 1.6 / 2.3 / 12.9 |
65536
| 5.2 / 6.6 / n/a | 5.4 / 6.4 / n/a | 5.5 / 6.4 / n/a | 5.5 / 6.8 / n/a | 5.4 / 7.4 / n/a |
| 1.0 / 0.4 / 3.6 | 1.8 / 0.5 / 3.7 | 3.0 / 0.4 / 4.1 | 4.2 / 1.9 / 4.9 | 5.5 / 4.2 / 6.0 |
| 1.1 / 0.4 / 2.0 | 1.4 / 0.4 / 2.1 | 1.5 / 0.5 / 2.4 | 2.0 / 1.4 / 9.8 | 3.2 / 3.4 / 14.8 |
131072
| 6.5 / 7.8 / n/a | 6.6 / 7.6 / n/a | 6.8 / 7.4 / n/a | 6.9 / 7.7 / n/a | 6.8 / 8.6 / n/a |
| 2.0 / 1.4 / 4.6 | 2.9 / 1.4 / 4.8 | 4.1 / 1.5 / 5.2 | 5.2 / 2.4 / 5.8 | 6.8 / 5.4 / 7.0 |
| 2.1 / 1.4 / 3.1 | 2.4 / 1.4 / 3.1 | 2.5 / 1.5 / 3.3 | 3.0 / 2.0 / 9.9 | 4.4 / 4.6 / 16.6 |
262144
| 7.5 / 8.9 / n/a | 7.6 / 8.9 / n/a | 7.8 / 8.6 / n/a | 8.0 / 8.8 / n/a | 8.2 / 9.6 / n/a |
| 3.0 / 2.4 / 5.6 | 3.9 / 2.4 / 5.7 | 5.1 / 2.4 / 6.1 | 6.1 / 2.9 / 6.7 | 8.1 / 6.4 / 8.1 |
| 3.1 / 2.5 / 4.1 | 3.3 / 2.4 / 4.1 | 3.5 / 2.4 / 4.2 | 4.7 / 3.6 / 9.9 | 5.7 / 5.8 / 18.2 |
524288
| 8.6 / 10.0 / n/a | 8.8 / 10.0 / n/a | 9.0 / 9.6 / n/a | 9.4 / 9.7 / n/a | 9.3 / 10.4 / n/a |
| 4.0 / 3.4 / 6.6 | 4.9 / 3.4 / 6.7 | 6.1 / 3.4 / 7.1 | 7.0 / 3.7 / 7.6 | 8.9 / 7.0 / 8.8 |
| 4.1 / 3.5 / 5.0 | 4.4 / 3.4 / 5.1 | 4.5 / 3.4 / 5.2 | 4.9 / 3.6 / 9.9 | 6.8 / 6.5 / 19.2 |
1048576
| 9.7 / 11.0 / n/a | 9.9 / 11.1 / n/a | 10.2 / 10.7 / n/a | 10.7 / 10.7 / n/a | 10.7 / 11.2 / n/a |
| 5.0 / 4.4 / 7.5 | 5.9 / 4.4 / 7.7 | 7.1 / 4.4 / 8.1 | 8.0 / 4.6 / 8.5 | 9.7 / 7.3 / 9.8 |
| 5.1 / 4.4 / n/a | 5.3 / 4.4 / n/a | 5.5 / 4.4 / n/a | 5.9 / 4.6 / n/a | 7.7 / 6.8 / n/a |
2097152
| 10.8 / 12.0 / n/a | 11.0 / 12.1 / n/a | 11.3 / 11.8 / n/a | 12.1 / 11.8 / n/a | 12.0 / 12.1 / n/a |
| 6.0 / 5.4 / 8.5 | 7.0 / 5.4 / 8.7 | 8.1 / 5.4 / 9.1 | 9.0 / 5.6 / 9.5 | 10.6 / 7.6 / 10.3 |
| 6.1 / 5.4 / n/a | 6.4 / 5.4 / n/a | 6.6 / 5.4 / n/a | 6.9 / 5.6 / n/a | 8.8 / 7.2 / n/a |
4194304
| 11.9 / 13.0 / n/a | 12.0 / 13.1 / n/a | 12.5 / 12.9 / n/a | 13.3 / 12.8 / n/a | 13.2 / 13.0 / n/a |
| 7.0 / 6.4 / 9.5 | 8.0 / 6.4 / 9.7 | 9.2 / 6.4 / 10.1 | 10.1 / 6.5 / 10.5 | 11.6 / 8.0 / 11.1 |
| 7.1 / 6.4 / n/a | 7.3 / 6.4 / n/a | 7.6 / 6.4 / n/a | 8.0 / 6.5 / n/a | 9.9 / 7.7 / n/a |
8388608
| n/a / n/a / n/a | n/a / n/a / n/a | 13.7 / 14.1 / n/a | 14.5 / 13.8 / n/a | 14.4 / 13.9 / n/a |
| 8.0 / 7.4 / 10.5 | 9.0 / 7.4 / 10.7 | 10.2 / 7.4 / 11.1 | 11.1 / 7.5 / 11.5 | 12.6 / 8.5 / 12.0 |
| 8.1 / 7.4 / n/a | 8.4 / 7.4 / n/a | 8.6 / 7.4 / n/a | 9.1 / 7.5 / n/a | 10.8 / 8.3 / n/a |
16777216
| n/a / n/a / n/a | n/a / n/a / n/a | n/a / n/a / n/a | n/a / n/a / n/a | n/a / n/a / n/a |
| 9.0 / 8.4 / 11.6 | 10.0 / 8.4 / 11.7 | 11.2 / 8.4 / 12.1 | 12.2 / 8.4 / 12.5 | 13.6 / 9.1 / 12.9 |
| 9.1 / 8.4 / n/a | 9.3 / 8.4 / n/a | 9.6 / 8.4 / n/a | 10.1 / 8.4 / n/a | 11.9 / 9.0 / n/a |
所有价值低于100的行都没有显示,因为它们没有实际意义,可以被认为是热身。
所有测试仅执行一次,没有进行平滑,因此可以在任一方向上进行尖峰。超过10000的值的测试运行了相当长的时间,以至少排除短尖峰。我重复了整个基准测试几次,差异在10%以内。
数据结构尚未使用他们可能期望保留的适当数量的元素进行初始化。部分原因是由于内存消耗量较大而导致。
OMD Dequeuing没有值,因为我发现没有合理的方法来实现它。我很感激任何帮助。
对于较大的值,结果非常一致。
关于内存使用情况,OMD使用的内存比选项2和3多几倍,并且一直抛出超过500万个值的OutOfMemory异常。选项3再次使用明显少于选项2的内存。在每次单个测试之后,执行完整的垃圾收集。
总之,我建议使用队列的SortedDictionary,因为它往往与使用较少内存时在Power Collections中使用的RB树方法一样快。如果几个不同的优先级值,则优势会增加。当然,这只在你处理大量数据时才有意义。
添加SortedDictionary的源代码。更多信息可以在http://pastebin.com/J4snVYzb
找到public class PriorityQueue<TK, TV>
{
private readonly SortedDictionary<TK, Queue<TV>> _D = new SortedDictionary<TK, Queue<TV>> ();
public void Enqueue (TK key, TV value)
{
Queue<TV> list;
if (!_D.TryGetValue (key, out list)) {
list = new Queue<TV> ();
_D.Add (key, list);
}
list.Enqueue (value);
Count++;
}
public int Count
{
get;
private set;
}
public TV Dequeue ()
{
var first = _D.First ();
var item = first.Value.Dequeue ();
if (!first.Value.Any ()) {
_D.Remove (first.Key);
}
return item;
}
public IEnumerable<TV> Values
{
get
{
var keys = _D.Keys.ToArray ();
foreach (var key in keys) {
foreach (var item in _D[key]) {
yield return item;
}
}
}
}
}