UUID有多独特?

时间:2009-07-20 18:06:41

标签: guid uniqueidentifier uuid

使用UUID唯一标识某些内容(我将其用于上传到服务器的文件)有多安全?据我了解,它基于随机数。然而,在我看来,如果有足够的时间,它最终会重复自我,只是纯粹的机会。是否有更好的系统或某种类型的模式来缓解这个问题?

12 个答案:

答案 0 :(得分:356)

非常安全:

  

某个人被陨石击中的年度风险是   估计是170亿的一次机会,这意味着   概率约为0.00000000006(6×10 -11 ),相当于赔率   在一年内创造几十万亿的UUID并拥有一个   重复。换句话说,只有在每次产生10亿UUID之后   在接下来的100年中,仅创造一个的概率   重复约为50%。

警告:

  

但是,这些概率仅在生成UUID时才成立   使用足够的熵。否则,重复的概率   因为统计分散可能会显着提高   低一点分布式需要唯一标识符的位置   应用程序,以便即使来自许多数据的UUID也不会发生冲突   设备合并,使用的种子和发电机的随机性   每个设备必须在应用程序的生命周期内可靠。哪里   这是不可行的,RFC4122建议使用命名空间变体   代替。

来源:维基百科关于通用唯一标识符的文章的Random UUID probability of duplicates section(链接指向2016年12月之前的修订版,然后编辑重新编写该部分)。

另请参阅同一个Universe唯一标识符文章Collisions上有关同一主题的当前部分。

答案 1 :(得分:130)

如果“给予足够的时间”意味着100年并且你以每秒10亿的速度创造它们,那么是的,你有50%的机会在100年后发生碰撞。

答案 2 :(得分:91)

有多种类型的UUID,因此“安全性”取决于您使用的类型(UUID规范称之为“版本”)。

  • 版本1是基于时间的加上MAC地址UUID。 128位包含48位用于网卡的MAC地址(由制造商唯一分配)和60位时钟,分辨率为100纳秒。那个时钟wraps in 3603 A.D.所以这些UUID至少在那时是安全的(除非你每秒需要超过1000万个新的UUID或有人克隆你的网卡)。我说“至少”是因为时钟从1582年10月15日开始,所以你在时钟结束后大约有400年才会出现重复的可能性。

  • 版本4是随机数UUID。有六个固定位,UUID的其余部分是122位随机性。请参阅Wikipedia或描述副本不太可能的其他分析。

  • 版本3使用MD5,版本5使用SHA-1创建122位,而不是随机或伪随机数生成器。因此,就安全性而言,版本4就像一个统计问题(只要您确定摘要算法处理的内容始终是唯一的)。

  • 版本2类似于版本1,但是时钟较小,因此它会更快地回绕。但由于版本2 UUID适用于DCE,因此您不应使用这些。

因此,对于所有实际问题,他们都是安全的。如果你对将其留在概率中感到不舒服(例如,你担心地球在你的一生中被大型小行星摧毁的那种类型),那么请确保使用版本1 UUID并保证它是唯一的(在你的一生中,除非你打算过去公元3603年。)

那为什么不是每个人都只使用版本1 UUID?这是因为版本1 UUID显示了它生成的机器的MAC地址,并且它们是可预测的 - 这两个可能对使用这些UUID的应用程序产生安全隐患。

答案 3 :(得分:16)

答案可能主要取决于UUID版本。

许多UUID生成器使用版本4随机数。但是,其中许多使用Pseudo a Random Number Generator来生成它们。

如果使用播种时间很短的PRNG来生成UUID,我会说它根本不安全。

因此,它仅与用于生成它的算法一样安全。

另一方面,如果您知道这些问题的答案,那么我认为使用版本4 uuid应该是非常安全的。事实上,我正在使用它来识别网络块文件系统上的块,到目前为止还没有发生冲突。

在我的情况下,我使用的PRNG是一个mersenne twister,我小心它的播种方式来自多个来源,包括/ dev / urandom。 Mersenne twister的周期为2 ^ 19937 - 1.在我看到重复的uuid之前,这将是一段很长的时间。

答案 4 :(得分:14)

引自Wikipedia

  

因此,任何人都可以创建UUID并使用   它用来识别某些东西   合理的信心   标识符永远不会   无意中被任何人用于   别的什么

它继续详细解释它实际上是多么安全。所以回答你的问题:是的,它足够安全。

答案 5 :(得分:8)

UUID方案通常不仅使用伪随机元素,还使用当前系统时间,以及某些通常唯一的硬件ID(如果可用),例如网络MAC地址。

使用UUID的重点在于您相信它可以更好地提供比您自己能够做到的唯一ID。这与使用第三方加密库而不是自己编写密码库背后的原理相同。自己动手可能会更有趣,但这样做通常不那么负责任。

答案 6 :(得分:5)

多年来一直这样做。永远不会遇到问题。

我通常设置我的数据库有一个包含所有键和修改日期等的表。没有遇到过重复密钥的问题。

唯一的缺点是,当您编写一些查询以快速查找某些信息时,您正在进行大量复制和粘贴密钥。你再也没有简单易记的ids了。

答案 7 :(得分:5)

这里有一个测试片段供您测试它的独特性。 灵感来自@ scalabl3的评论

  

有趣的是,你可以连续产生两个相同的,当然是令人难以置信的巧合,运气和神圣的干预,但尽管有不可思议的几率,它仍然是可能的! :D是的,它不会发生。只是说当你创造一个复制品时,想到那个时刻的乐趣!截图视频! - scalabl3 Oct 20&15; 15 at 19:11

如果您感到幸运,请选中该复选框,它仅检查当前生成的ID。如果您希望进行历史记录检查,请将其保留为未选中状态。 请注意,如果不加以控制,您可能会在某些时候用完ram。我试图使它对cpu友好,所以你可以在需要时快速中止,只需再次点击运行摘录按钮或离开页面。



Math.log2 = Math.log2 || function(n){ return Math.log(n) / Math.log(2); }
  Math.trueRandom = (function() {
  var crypt = window.crypto || window.msCrypto;

  if (crypt && crypt.getRandomValues) {
      // if we have a crypto library, use it
      var random = function(min, max) {
          var rval = 0;
          var range = max - min;
          if (range < 2) {
              return min;
          }

          var bits_needed = Math.ceil(Math.log2(range));
          if (bits_needed > 53) {
            throw new Exception("We cannot generate numbers larger than 53 bits.");
          }
          var bytes_needed = Math.ceil(bits_needed / 8);
          var mask = Math.pow(2, bits_needed) - 1;
          // 7776 -> (2^13 = 8192) -1 == 8191 or 0x00001111 11111111

          // Create byte array and fill with N random numbers
          var byteArray = new Uint8Array(bytes_needed);
          crypt.getRandomValues(byteArray);

          var p = (bytes_needed - 1) * 8;
          for(var i = 0; i < bytes_needed; i++ ) {
              rval += byteArray[i] * Math.pow(2, p);
              p -= 8;
          }

          // Use & to apply the mask and reduce the number of recursive lookups
          rval = rval & mask;

          if (rval >= range) {
              // Integer out of acceptable range
              return random(min, max);
          }
          // Return an integer that falls within the range
          return min + rval;
      }
      return function() {
          var r = random(0, 1000000000) / 1000000000;
          return r;
      };
  } else {
      // From http://baagoe.com/en/RandomMusings/javascript/
      // Johannes Baagøe <baagoe@baagoe.com>, 2010
      function Mash() {
          var n = 0xefc8249d;

          var mash = function(data) {
              data = data.toString();
              for (var i = 0; i < data.length; i++) {
                  n += data.charCodeAt(i);
                  var h = 0.02519603282416938 * n;
                  n = h >>> 0;
                  h -= n;
                  h *= n;
                  n = h >>> 0;
                  h -= n;
                  n += h * 0x100000000; // 2^32
              }
              return (n >>> 0) * 2.3283064365386963e-10; // 2^-32
          };

          mash.version = 'Mash 0.9';
          return mash;
      }

      // From http://baagoe.com/en/RandomMusings/javascript/
      function Alea() {
          return (function(args) {
              // Johannes Baagøe <baagoe@baagoe.com>, 2010
              var s0 = 0;
              var s1 = 0;
              var s2 = 0;
              var c = 1;

              if (args.length == 0) {
                  args = [+new Date()];
              }
              var mash = Mash();
              s0 = mash(' ');
              s1 = mash(' ');
              s2 = mash(' ');

              for (var i = 0; i < args.length; i++) {
                  s0 -= mash(args[i]);
                  if (s0 < 0) {
                      s0 += 1;
                  }
                  s1 -= mash(args[i]);
                  if (s1 < 0) {
                      s1 += 1;
                  }
                  s2 -= mash(args[i]);
                  if (s2 < 0) {
                      s2 += 1;
                  }
              }
              mash = null;

              var random = function() {
                  var t = 2091639 * s0 + c * 2.3283064365386963e-10; // 2^-32
                  s0 = s1;
                  s1 = s2;
                  return s2 = t - (c = t | 0);
              };
              random.uint32 = function() {
                  return random() * 0x100000000; // 2^32
              };
              random.fract53 = function() {
                  return random() +
                      (random() * 0x200000 | 0) * 1.1102230246251565e-16; // 2^-53
              };
              random.version = 'Alea 0.9';
              random.args = args;
              return random;

          }(Array.prototype.slice.call(arguments)));
      };
      return Alea();
  }
}());

Math.guid = function() {
    return 'xxxxxxxx-xxxx-4xxx-yxxx-xxxxxxxxxxxx'.replace(/[xy]/g, function(c)    {
      var r = Math.trueRandom() * 16 | 0,
          v = c == 'x' ? r : (r & 0x3 | 0x8);
      return v.toString(16);
  });
};
function logit(item1, item2) {
    console.log("Do "+item1+" and "+item2+" equal? "+(item1 == item2 ? "OMG! take a screenshot and you'll be epic on the world of cryptography, buy a lottery ticket now!":"No they do not. shame. no fame")+ ", runs: "+window.numberofRuns);
}
numberofRuns = 0;
function test() {
   window.numberofRuns++;
   var x = Math.guid();
   var y = Math.guid();
   var test = x == y || historyTest(x,y);

   logit(x,y);
   return test;

}
historyArr = [];
historyCount = 0;
function historyTest(item1, item2) {
    if(window.luckyDog) {
       return false;
    }
    for(var i = historyCount; i > -1; i--) {
        logit(item1,window.historyArr[i]);
        if(item1 == history[i]) {
            
            return true;
        }
        logit(item2,window.historyArr[i]);
        if(item2 == history[i]) {
            
            return true;
        }

    }
    window.historyArr.push(item1);
    window.historyArr.push(item2);
    window.historyCount+=2;
    return false;
}
luckyDog = false;
document.body.onload = function() {
document.getElementById('runit').onclick  = function() {
window.luckyDog = document.getElementById('lucky').checked;
var val = document.getElementById('input').value
if(val.trim() == '0') {
    var intervaltimer = window.setInterval(function() {
         var test = window.test();
         if(test) {
            window.clearInterval(intervaltimer);
         }
    },0);
}
else {
   var num = parseInt(val);
   if(num > 0) {
        var intervaltimer = window.setInterval(function() {
         var test = window.test();
         num--;
         if(num < 0 || test) {
    
         window.clearInterval(intervaltimer);
         }
    },0);
   }
}
};
};
&#13;
Please input how often the calulation should run. set to 0 for forever. Check the checkbox if you feel lucky.<BR/>
<input type="text" value="0" id="input"><input type="checkbox" id="lucky"><button id="runit">Run</button><BR/>
&#13;
&#13;
&#13;

答案 8 :(得分:2)

我不知道这对您是否重要,但请记住GUIDs are globally unique, but substrings of GUIDs aren't

答案 9 :(得分:2)

我同意其他答案。 UUID对于几乎所有实际用途 1 都是安全的,当然对您也是如此。

但是(假设)不是。

  

是否有更好的系统或某种类型的模式可以缓解此问题?

以下是几种方法:

  1. 使用更大的UUID。例如,假设您有可靠的熵源,而不是128个随机位,而应使用256或512或...添加到4型样式UUID的每个位将使碰撞的可能性降低一半。 sup> 2 。

  2. 构建一个集中式或分布式服务,该服务可生成UUID并记录其发布的每一个。每次生成新的UUID时,都会检查该UUID之前从未发行过。如果我们假设运行该服务的人员绝对值得信赖,廉洁等,那么从技术上讲,要实现该服务就很简单。不幸的是,它们并非……尤其是在政府有可能干预的情况下。因此,这种方法可能不切实际,并且在现实世界中可能是 3 不可能的。


1-如果UUID的唯一性决定了核导弹是否是在贵国首都发射的,那么许多同胞将不会被“概率极低”说服。因此是我的“几乎所有”资格。

2-这是您要解决的一个哲学问题。有没有真正随机的东西?我们怎么知道不是吗?我们所知道的宇宙是模拟吗?有没有一位神可以想象“调整”物理定律以改变结果?

3-如果有人知道有关此问题的任何研究论文,请发表评论。

答案 10 :(得分:1)

对于UUID4,我使它的ID大约与边长360,000 km的立方体形盒子中的沙粒数量一样多。那是一个盒子,其边长是木星直径的约2.5倍。

工作,以便有人可以告诉我是否弄乱了单位:

  • 沙粒体积0.00947mm ^ 3(Guardian
  • UUID4具有122个随机位-> 5.3e36个可能的值(wikipedia
  • 那么多沙粒的体积= 5.0191e34 mm ^ 3或5.0191e + 25m ^ 3
  • 体积为3.69E8m或369,000km的立方箱的边长
  • 木星直径:139,820公里(谷歌)

答案 11 :(得分:0)

我应该提到我在亚马逊上购买了两个外置希捷硬盘,它们具有相同的设备 UUID,但 PARTUUID 不同。据推测,他们用来格式化驱动器的克隆软件也只是复制了 UUID。

显然,由于有缺陷的克隆或复制过程而不是随机巧合,UUID 冲突更有可能发生。在计算 UUID 风险时请记住这一点。