在c ++中将md5字​​符串转换为base 62字符串

时间:2010-10-24 05:10:57

标签: c++ md5 base62

我正在尝试将md5字​​符串(base 16)转换为c ++中的base 62字符串。到目前为止我发现的转换为base 62的每个解决方案只有在你可以将你的数字表示为64位整数或更小时才有效。一个md5字符串是128位,我自己就没有这个了。

我应该只包含一个bigint库并完成它吗?

3 个答案:

答案 0 :(得分:4)

我们来看看。 128 / LOG2(62)= 21.497。这意味着你需要22个“数字”作为base-62表示。

如果您只对不超过22个字符且不使用超过62个不同字符的字符串表示感兴趣,则不需要真正的base-62表示。您可以将128位分成更小的部分并分别编码。这样你就不需要任何128位算术。您可以将128位分割为2x64位,并使用长度为11的字符串对每个64位块进行编码。甚至可以使用57个不同的字符进行编码。因此,您可以消除62个字符中的5个以避免任何“视觉模糊”。例如,删除l,1,B,8。这留下了58个不同的字符和11 * log2(58)= 64.438,这足以编码64位。

获得两个64位块并不困难:

#include <climits>

#if CHAR_BIT != 8
#error "platform not supported, CHAR_BIT==8 expected"
#endif

// 'long long' is not yet part of C++
// But it's usually a supported extension
typedef unsigned long long uint64;

uint64 bits2uint64_bigendian(unsigned char const buff[]) {
   return (static_cast<uint64>(buff[0]) << 56)
        | (static_cast<uint64>(buff[1]) << 48)
        | (static_cast<uint64>(buff[2]) << 40)
        | (static_cast<uint64>(buff[3]) << 32)
        | (static_cast<uint64>(buff[4]) << 24)
        | (static_cast<uint64>(buff[5]) << 16)
        | (static_cast<uint64>(buff[6]) <<  8)
        |  static_cast<uint64>(buff[7]);
}

int main() {
   unsigned char md5sum[16] = {...};
   uint64 hi = bits2uint64_bigendian(md5sum);
   uint64 lo = bits2uint64_bigendian(md5sum+8);
}

答案 1 :(得分:2)

为简单起见,您可以使用我的uint128_t c ++类(http://www.codef00.com/code/uint128.h)。有了它,基本转换器看起来就像这样简单:

#include "uint128.h"
#include <iostream>
#include <algorithm>

int main() {
    char a[] = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789";
    uint128_t x = U128_C(0x130eb6003540debd012d96ce69453aed);

    std::string r;
    r.reserve(22); // shouldn't result in more than 22 chars 
                   // 6-bits per 62-bit value means (128 / 6 == 21.3)

    while(x != 0) {
        r += a[(x % 62).to_integer()];
        x /= 62;
    }

    // when converting bases by division, the digits are reversed...fix that :-)
    std::reverse(r.begin(), r.end());
    std::cout << r << std::endl;
}

打印:

J7JWEJ0YbMGqaJFCGkUxZ

答案 2 :(得分:0)

GMP为任意精度整数提供了方便的c ++绑定