了解Base64编码算法的指导

时间:2014-09-04 22:47:21

标签: javascript algorithm encoding base64 bit-shift

我在网上找到了这个算法,但我很难理解它是如何工作的。它将Uint8Array编码为Base64。我想特别理解评论中的部分"将三个字节组合成一个整数"和"使用位掩码从三元组中提取6位段#34;我理解在那里使用的位移概念,但不能理解它在这两个部分中的用途。

function base64ArrayBuffer(bytes) {
  var base64    = ''
  var encodings = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/'

  var byteLength    = bytes.byteLength
  var byteRemainder = byteLength % 3
  var mainLength    = byteLength - byteRemainder

  var a, b, c, d
  var chunk

  // Main loop deals with bytes in chunks of 3
  for (var i = 0; i < mainLength; i = i + 3) {
    // Combine the three bytes into a single integer
    chunk = (bytes[i] << 16) | (bytes[i + 1] << 8) | bytes[i + 2]

    // Use bitmasks to extract 6-bit segments from the triplet
    a = (chunk & 16515072) >> 18 // 16515072 = (2^6 - 1) << 18
    b = (chunk & 258048)   >> 12 // 258048   = (2^6 - 1) << 12
    c = (chunk & 4032)     >>  6 // 4032     = (2^6 - 1) << 6
    d = chunk & 63               // 63       = 2^6 - 1

    // Convert the raw binary segments to the appropriate ASCII encoding
    base64 += encodings[a] + encodings[b] + encodings[c] + encodings[d]
  }

  // Deal with the remaining bytes and padding
  if (byteRemainder == 1) {
    chunk = bytes[mainLength]

    a = (chunk & 252) >> 2 // 252 = (2^6 - 1) << 2

    // Set the 4 least significant bits to zero
    b = (chunk & 3)   << 4 // 3   = 2^2 - 1

    base64 += encodings[a] + encodings[b] + '=='
  } else if (byteRemainder == 2) {
    chunk = (bytes[mainLength] << 8) | bytes[mainLength + 1]

    a = (chunk & 64512) >> 10 // 64512 = (2^6 - 1) << 10
    b = (chunk & 1008)  >>  4 // 1008  = (2^6 - 1) << 4

    // Set the 2 least significant bits to zero
    c = (chunk & 15)    <<  2 // 15    = 2^4 - 1

    base64 += encodings[a] + encodings[b] + encodings[c] + '='
  }

  return base64
}

1 个答案:

答案 0 :(得分:0)

第一步是在输入中取每组3个字节,并将它们组合成一个24位数字。如果我们称它们为x = bytes[i]y = bytes[i+1]z = bytes[i+2],它会使用位移和位或来创建一个24位整数,其位为:

xxxxxxxxyyyyyyyyzzzzzzzz

然后它以6个为一组提取这些位以得到4个数字。 abcd的位对应于此:

xxxxxxxxyyyyyyyyzzzzzzzz
aaaaaabbbbbbccccccdddddd

然后,对于这些6位数字中的每一个,它将encodings字符串编入索引以获取相应的字符,并将它们连接到base64结果字符串。

最后有一些特殊情况可以处理输入中的最后1或2个字节,如果它不是3个字节长的倍数。