我正在创建一个面向文件的数据库,其中包含由各种用户执行的一些测试结果。为此,我需要为数据库中的每个条目生成唯一的id。 ID必须满足以下要求:
我尝试的是一个简单的BKDR哈希函数,其种子值为31,并使用了ord()函数,如下所示:
@chars = split(//,$hash_var);
$hash = 0;
$seed = 31;
foreach $char ( @chars ) {
if( $char !~ m/\d/ ) {
$hash = ( $seed * $hash ) + ord( $char );
}
else {
$hash = ( $seed * $hash ) + $char ;
}
}
$hash = ( $hash & 0x7FFFFFFF ) % 1000;
$hash = "$chars[0]$chars[$#chars]$hash" ;
这有时会导致各种组合的相同结果,即未观察到唯一性。他们是否有其他方法可以实现这一目标?改变种子价值有助于实现独特性。
答案 0 :(得分:5)
每个用户有超过256个用户和/或超过65536个测试用例吗?如果没有,你可以只对0到255的用户进行索引,并测试0到65535的情况,并将其编码为十六进制数字字符串,这样六个字符就可以了。
如果你有更多的用户或测试用例,我会再次为用户和测试用例编制索引,然后将它们组合成一个32位整数,实际上只需要4个字节,实现起来很简单,但对人类来说却稍微困难一些
无论如何,我假设您获得了用户名和测试用例信息。只需保留两个并列哈希:%users
和%cases
即可将用户和测试用例映射到其索引号。
答案 1 :(得分:3)
您的部分问题可能是您正在使用浮点数学而BKDR几乎肯定需要整数数学。您可以通过说
来修复该错误my @chars = split(//,$hash_var);
my $hash = 0;
my $seed = 31;
for my $char ( @chars ) {
use integer;
if( $char !~ m/\d/ ) {
$hash = ( $seed * $hash ) + ord( $char );
}
else {
$hash = ( $seed * $hash ) + $char ;
}
}
$hash = ( $hash & 0x7FFFFFFF ) % 1000;
$hash = "$chars[0]$chars[$#chars]$hash" ;
另一个可能有用的调整是使用除第一个和最后一个之外的字符。如果第一个和最后一个字符趋于相同,则它们不会为哈希添加唯一性。
您可能还想使用更好的哈希函数,如MD5(在Digest :: MD5中可用),并将结果修剪为所需的大小。但是,您使用散列的事实意味着您可能会发生冲突。
答案 2 :(得分:1)
如果您没有很多用户/测试用例,这样的简单解决方案就足够了。您必须添加限制(可能在存储时包装整数)。
vinko@parrot:~# more hash.pl
use strict;
use warnings;
my %hash;
my $count = 0;
sub getUniqueId {
my $_user = shift;
my $_test = shift;
my $val;
my $key = $_user."|".$_test;
if (defined $hash{$key}) {
$val = $hash{$key};
} else {
$hash{$key} = $count;
$val = $count;
$count = $count + 1;
}
return $val;
}
my @users = qw{ user1 user2 user3 user4 user5 user3 user5 };
my @testcases = qw{ test1 test2 test3 test1 test1 };
for my $user (@users) {
for my $test (@testcases) {
print "$user $test: ".getUniqueId($user,$test)."\n";
}
}
vinko@parrot:~# perl hash.pl
user1 test1: 0
user1 test2: 1
user1 test3: 2
user1 test1: 0
user1 test1: 0
user2 test1: 3
user2 test2: 4
user2 test3: 5
user2 test1: 3
user2 test1: 3
user3 test1: 6
user3 test2: 7
user3 test3: 8
user3 test1: 6
user3 test1: 6
user4 test1: 9
user4 test2: 10
user4 test3: 11
user4 test1: 9
user4 test1: 9
user5 test1: 12
user5 test2: 13
user5 test3: 14
user5 test1: 12
user5 test1: 12
user3 test1: 6
user3 test2: 7
user3 test3: 8
user3 test1: 6
user3 test1: 6
user5 test1: 12
user5 test2: 13
user5 test3: 14
user5 test1: 12
user5 test1: 12