C ++ Base64 Unicode - 空字节

时间:2015-09-27 02:05:47

标签: c++ unicode base64

我正在尝试base64编码一个unicode字符串。我遇到了问题,在编码之后,输出是我的字符串base64'ed但是,整个代码中的随机位置都有空字节,我不知道为什么,或者如何将它们取出。

这是我的Base64Encode功能:

static char Base64Digits[] =
"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
int Base64Encode(const BYTE* pSrc, int nLenSrc, wchar_t* pDst, int nLenDst)
{
   int nLenOut= 0;
   while ( nLenSrc > 0 ) {
  if (nLenOut+4 > nLenDst) return(0); // error

  // read three source bytes (24 bits) 
  BYTE s1= pSrc[0];   // (but avoid reading past the end)
  BYTE s2= 0; if (nLenSrc>1) s2=pSrc[1]; //------ corrected, thanks to  jprichey
  BYTE s3= 0; if (nLenSrc>2) s3=pSrc[2];

  DWORD n;
  n =  s1;    // xxx1
  n <<= 8;    // xx1x
  n |= s2;    // xx12  
  n <<= 8;    // x12x
  n |= s3;    // x123  

  //-------------- get four 6-bit values for lookups
  BYTE m4= n & 0x3f;  n >>= 6;
  BYTE m3= n & 0x3f;  n >>= 6;
  BYTE m2= n & 0x3f;  n >>= 6;
  BYTE m1= n & 0x3f;  

  //------------------ lookup the right digits for output
  BYTE b1 = Base64Digits[m1];
  BYTE b2 = Base64Digits[m2];
  BYTE b3 = Base64Digits[m3];
  BYTE b4 = Base64Digits[m4];

  //--------- end of input handling
  *pDst++ = b1;
  *pDst++ = b2;
  if ( nLenSrc >= 3 ) {  // 24 src bits left to encode, output xxxx
     *pDst++ = b3;
     *pDst++ = b4;
  }
  if ( nLenSrc == 2 ) {  // 16 src bits left to encode, output xxx=
     *pDst++ = b3;
     *pDst++ = '=';
     }
  if ( nLenSrc == 1 ) {  // 8 src bits left to encode, output xx==
     *pDst++ = '=';
     *pDst++ = '=';
  }
  pSrc    += 3;
  nLenSrc -= 3;
  nLenOut += 4;
 }
 // Could optionally append a NULL byte like so:
 // *pDst++= 0; nLenOut++;
 return( nLenOut );  
}

不要愚弄任何人,但我从here

复制了这个功能

以下是我如何调用该函数:

wchar_t base64[256];

Base64Encode((const unsigned char *)UserLoginHash, lstrlenW(UserLoginHash) * 2, base64, 256);

那么,为什么生成的哈希中会出现随机空字节或“空格”?什么应该改变,以便我可以摆脱它们?

2 个答案:

答案 0 :(得分:2)

尝试更像这样的东西。从我自己的base64编码器复制的部分:

static const wchar_t *Base64Digits = L"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";

int Base64Encode(const BYTE* pSrc, int nLenSrc, wchar_t* pDst, int nLenDst)
{
    int nLenOut = 0;

    while (nLenSrc > 0) {
        if (nLenDst < 4) return(0); // error

        // read up to three source bytes (24 bits) 
        int len = 0;
        BYTE s1 = pSrc[len++];
        BYTE s2 = (nLenSrc > 1) ? pSrc[len++] : 0
        BYTE s3 = (nLenSrc > 2) ? pSrc[len++] : 0;
        pSrc += len;
        nLenSrc -= len;

        //------------------ lookup the right digits for output
        pDst[0] = Base64Digits[(s1 >> 2) & 0x3F];
        pDst[1] = Base64Digits[(((s1 & 0x3) << 4) | ((s2 >> 4) & 0xF)) & 0x3F];
        pDst[2] = Base64Digits[(((s2 & 0xF) << 2) | ((s3 >> 6) & 0x3)) & 0x3F];
        pDst[3] = Base64Digits[s3 & 0x3F];

        //--------- end of input handling
        if (len < 3) {  // less than 24 src bits encoded, pad with '='
          pDst[3] = L'=';
          if (len == 1)
            pDst[2] = L'=';
        }

        nLenOut += 4;
        pDst += 4;
        nLenDst -= 4;
    }

    if (nLenDst > 0) *pDst = 0;

    return (nLenOut);
}

答案 1 :(得分:0)

从我所看到的问题是,当编码器工作时,偶尔它会为某个字符值添加一个值,例如,假设U + 0070 + U + 0066(这只是一个例子) 。在某些时候,这些值等于空终止符(\ 0)或等价于它的东西,使得程序在输出字符串并使其看起来比它应该更短时不会读取该点。

我以前用自己的编码算法遇到过这个问题,最好的解决办法似乎是为你的算法添加更多的可变性;所以,不是只在字符串中添加字符,而是在算法中的某个点减去一些,乘以或者一些XOR。这应该删除(或至少减少机会)null终止符出现在你不想要它们的地方。但是,这可能需要您进行一些反复试验,以确定哪些有效,哪些无效。