是否有一个公式可以找到实现整数集唯一性所需的最短长度

时间:2016-07-24 02:55:49

标签: javascript php mysql formula array-formulas

我希望能够计算实现完全唯一性所需的最短子串的长度。

假设我有一个不同长度的32个字符的UUID列表,但我想要实现的是在引用期间缩短它们只是为了在它们的集合中实现唯一性所需的时间。例如,如果我有以下一组UUID(插入管道来说明答案)......

428|07082e1f445e79501bebfa87396af 
723|0785bffaf4747865c202dd0924c7f
b65|634be909d4e5590aa0cdc97251eef
3c4|d94c683624d75a273e3186ec65b78
09e|bd42af0404bcf90413e11c5b40fbb
011|004743d65466dae8a9a6bc814ef4b
1f1|889e04e3a453fbf57521de0a70b60
1ac|44707af8d4681875171ad47c61037
42f|7a6236deb4a9ead32ab2e816d73a3
83a|fe22086064eec87704127622b8165

我只需要第一个三个字符来实现与我使用完整的32个字符串相同的唯一性。

我很好奇是否有达到该值的公式。我知道我可以将它放在几个嵌套循环中,但我想知道是否有更优雅或程序化的方法来实现这一点。

编辑:为了清楚起见,管道只是为了说明我只能在3个字符后才能达到唯一性。公式/方法的结果应该是一个长度相等的数组,只有从给定集合派生的最短字符串,在这种情况下,只有前三个字符。想象一下,我想在URL中使用这些,并且我不能有任何歧义,但仍然希望能够引用相同的记录,就好像我在每种情况下使用完整字符串一样。

EDIT2:实际上......正如我想的那样,不需要结果数组,只需要一个整数,字符所需的最小长度。

2 个答案:

答案 0 :(得分:2)

我设法创建了一些代码来实现这一目标。看看:

  • 代码1:
function check_un($array){
    $arr = $array;
    $len = 1;

    $tmp = array();

    while (list($key, $value) = each($arr)) {
        $v = substr($value, 0, $len);
        if (isset($tmp[$v])) {
            $tmp = array();
            $len++;
            reset($arr); // start again
        }
        $tmp[$v] = true;
    }
    $tmp = array_keys($tmp);
    array_shift($tmp);
    return $tmp;
}

基本上,前面的代码检查给定的子串put是否已经设置了密钥 - 意味着它是重复的。这样,它就会到达数组的开头并再次用更多的字母开始检查。

  • 代码2: (更小,但更慢)
function check_un($array){
    $array = array_values($array);
    $len = 1;
    $tmp = array();
    for($i = 0; $i < strlen($array[0]); $i++){
        if( count(array_unique( $tmp = array_map(function($v) use($len){ return substr($v, 0, $len); }, $array ) )) != count($array) ){
            $len++;
        }else{
            break;
        }
    }
    return $tmp; // this was set in the array_map part
}

基本上,前面的代码检查给定子串长度的唯一元素的数量是否与原始数组的数量相同。这样,如果有任何重复,数量将会更小,这意味着我们需要使用更多的位置。

曾经有一个代码3(我试过的第一个代码),但它只在编辑历史记录中可用。

你可以用它来测试它们:

$values = array(
    '42807082e1f445e79501bebfa87396af',
    '7230785bffaf4747865c202dd0924c7f',
    'b65634be909d4e5590aa0cdc97251eef',
    '3c4d94c683624d75a273e3186ec65b78',
    '09ebd42af0404bcf90413e11c5b40fbb',
    '011004743d65466dae8a9a6bc814ef4b',
    '1f1889e04e3a453fbf57521de0a70b60',
    '1ac44707af8d4681875171ad47c61037',
    '42f7a6236deb4a9ead32ab2e816d73a3',
    '83afe22086064eec87704127622b8165'
    //,'42807082e1f445e795aaaaaaaaaaaaa' // add this to test with more letters
);

$val = check_un($values);

结果(两种情况):

Array
(
    [0] => 428
    [1] => 723
    [2] => b65
    [3] => 3c4
    [4] => 09e
    [5] => 011
    [6] => 1f1
    [7] => 1ac
    [8] => 42f
    [9] => 83a
)

在这里看到他们的行动:

您可以更改返回值以仅获取$len变量。

答案 1 :(得分:0)

您可以使用Array.prototype.reduce()Object.hasOwnProperty()递归;创建一个对象来存储唯一字符集的值,如果name不是object的属性,则将对象名设置为前两个字符,否则设置第一个n个字符,直到object中的每个属性都是唯一的

&#13;
&#13;
var arr = ["42807082e1f445e79501bebfa87396af " 
           , "7230785bffaf4747865c202dd0924c7f" 
           , "b65634be909d4e5590aa0cdc97251eef" 
           , "3c4d94c683624d75a273e3186ec65b78"   
           , "09ebd42af0404bcf90413e11c5b40fbb" 
           , "011004743d65466dae8a9a6bc814ef4b" 
           , "1f1889e04e3a453fbf57521de0a70b60" 
           , "1ac44707af8d4681875171ad47c61037" 
           , "42f7a6236deb4a9ead32ab2e816d73a3" 
           , "83afe22086064eec87704127622b8165"];

var obj = {};

arr.reduce((o, uuid) => {
  var n = 1;
  (function re(key) {
    var curr = uuid.slice(0, key);
    if (!o.hasOwnProperty(curr)) {
      o[curr] = uuid;
    } else {
      re(key + 1)
    }
  }(n))
  return obj
}, obj);

console.log(obj, "arr length:", arr.length
           , "obj keys length:", Object.keys(obj).length);
&#13;
&#13;
&#13;