独特元素存储的数据结构

时间:2016-05-19 12:02:28

标签: list perl unique xs

我正在寻找一个最好应该执行相等O(1)的数据结构?添加/删除/检索元素时的任意数量的元素。

以下是一些其他指南,

  • 检索元素不应涉及慢keys()
  • 元素必须始终唯一且定义
  • 元素顺序不重要
  • 添加或删除元素不应涉及对其他元素的迭代
  • 检索到的元素列表中的间隙是可以容忍的,可以用undef
  • 表示

请建议更好的解决方案,

sub uniqArrayFactory {
  my $members = [];
  my $seen = {};
  my $gaps = [];

  return sub {
    my (%arg) = @_;

    return $members if $arg{members};
    my $m;
    if (defined ($m = $arg{del})) {

      return if !$seen->{$m};
      ${ $seen->{$m} } = undef;
      push @$gaps, delete($seen->{$m});
    }
    elsif (defined ($m = $arg{add})) {

      return if $seen->{$m};
      if (@$gaps) {
        $seen->{$m} = pop @$gaps;
        ${ $seen->{$m} } = $m;
      }
      else {
        push @$members, $m;
        $seen->{$m} = \( $members->[-1] );
      }
    }
    return $m;
  };
}

更新(使用)

my $fa = uniqArrayFactory();

$fa->(add => 10);
$fa->(del => 10);
my $members = $fa->(mebers => 1);

2 个答案:

答案 0 :(得分:2)

keyseach确实非常缓慢。但是如果你将每个元素存储为哈希的值并使用values,那么事情会变得更快。与

use strict;
use warnings;
use Benchmark qw(:all);

my $i;
my $fa;
my %hash;

my %compare = (
  uarray => sub {
    $fa->(add => $i++);
    my $memb = $fa->(members => 1);
    for my $v (@$memb) { next if !defined $v; }
  },
  hash => sub {
    $hash{ $i } = $i;
    for my $v (values %hash) {}
    $i++;
  },
);

$i = 0; $fa = uniqArrayFactory(); %hash = ();
cmpthese(10000, \%compare);

sub uniqArrayFactory {
  my $members = [];
  my $seen = {};
  my $gaps = [];

  return sub {
    my (%arg) = @_;

    return $members if exists $arg{members};
    my $m;
    if (defined ($m = $arg{del})) {

      return if !$seen->{$m};
      ${ $seen->{$m} } = undef;
      push @$gaps, delete($seen->{$m});
    }
    elsif (defined ($m = $arg{add})) {

      return if $seen->{$m};
      if (@$gaps) {
        $seen->{$m} = pop @$gaps;
        ${ $seen->{$m} } = $m;
      }
      else {
        push @$members, $m;
        $seen->{$m} = \( $members->[-1] );
      }
    }
    return $m;
  };
}

我明白了:

         Rate   hash uarray
hash   3205/s     --    -6%
uarray 3401/s     6%     --

答案 1 :(得分:1)

具有讽刺意味的是,也许Tie::IxHash,这是出于希望以指定的顺序检索哈希键的动机,就像你想要达到你想要的那样接近。

the Tie::IxHash implementation中,键和值存储在数组引用中。 keys会返回该组密钥的副本,但(tied %hash)->[1]之类的内容会让您直接访问该密钥。

删除Tie::IxHash中的元素是O(n)。可能的解决方法是用undef替换值而不是删除它们。也就是说,更喜欢

$ixhash{$obsolete_key} = undef;

delete $ixhash{$obsolete_key};

或者,如果你能够汇总你的删除 - 如果你可以组织你的代码,以便你通常在同一时间和哈希上的其他操作之间的几个键上调用delete - 那么改善Tie::IxHash的机会。