我想做fingerprint = Digest::SHA256.base64digest(str)
之类的事情,但是对于base62而不是base64。如何有效地构建任何字符串的唯一base62编码的字符串哈希?
更新:我无法相信2个人想要关闭这个问题,因为我不清楚我在问什么。我可以非常客观地说这个问题很清楚,如果你有问题,请发表评论,而不是默默地将其标记为关闭。感谢。
答案 0 :(得分:2)
Base 64广泛用于编码二进制数据,因为6位完全适合一个字符,但仍有足够的可打印ASCII字符来表示所有可能的模式。换句话说,64个可用字符代表从十进制0到十进制63的所有64种不同的位模式。
将二进制数据编码为基数62存在若干问题,基于62大小的字母表不适合的事实。您可以将摘要算法中的二进制数据映射到32位块,然后将这些5位块中的每一个分配给一个字符。但是,这意味着“v”以上的字符将不再使用,因此您最终将使用基本32编码。
在效率方面,基础62将从不甚至接近base64。 Base 64编码很简单:取6位,将它们映射到一个字符上,重复直到完成。这很简单,因为64是2的幂。然而,对于基数62,你必须转换为整数并开始在每一步中携带“余数”,因为模式不均匀。
所以我的建议,你可能不喜欢,是使用不同的编码。
-
如果您需要网址安全编码,您可以使用以下方法之一:
# sample string
str = 'foo'
# original base 64 method for comparison
Digest::SHA256.base64digest(str)
#=> "LCa0a2j/xo/5m0U8HTBBNBNCLXBkg7+g+YpeiGJm564="
# url safe variant (no slash or plus characters)
Base64.urlsafe_encode64(Digest::SHA256.digest(str))
#=> "LCa0a2j_xo_5m0U8HTBBNBNCLXBkg7-g-YpeiGJm564="
# hexadecimal (base 16)
Digest::SHA256.hexdigest(str)
#=> "2c26b46b68ffc68ff99b453c1d30413413422d706483bfa0f98a5e886266e7ae"
# or base 32
# gem install base32
require 'base32'
Base32.encode(Digest::SHA256.digest(str))
#=> "FQTLI23I77DI76M3IU6B2MCBGQJUELLQMSB37IHZRJPIQYTG46XA===="
# or with direct url encoding
# not pretty, but url safe!
require 'open-uri'
URI::encode(Digest::SHA256.digest(str))
#=> ",&%B4kh%FF%C6%8F%F9%9BE%3C%1D0A4%13B-pd%83%BF%A0%F9%8A%5E%88bf%E7%AE"
# or url url escaped base 64
# not pretty, but url safe!
require 'cgi'
CGI::escape(Digest::SHA256.base64digest(str))
#=> "LCa0a2j%2Fxo%2F5m0U8HTBBNBNCLXBkg7%2Bg%2BYpeiGJm564%3D"
-
编辑:这是base62非常非常低效的实现; - )
# gem install base62
require 'base62'
def pack_int(str)
str.unpack('C*').each_with_index.reduce(0){|r,(x,i)| r + (x << 8*i) }
end
def unpack_int(int)
n = (Math.log2(int)/8).ceil
n.times.map{|i| (int >> 8*i) & 255 }.pack('C*')
end
def base62_encode(str)
Base62.encode(pack_int(str))
end
def base62_decode(encoded)
unpack_int(Base62.decode(encoded))
end
str = "foo"
# encode
digest = Digest::SHA256.digest(str)
fingerprint = base62_encode(digest)
#=> "fTSIMrZT3fDTvW7XDBq1b7nhWa24Zl55EVpsaO3TBBE"
# decode
recovered_digest = base62_decode(fingerprint)
#=> ",&\xB4kh\xFF\xC6\x8F\xF9\x9BE<\x1D0A4\x13B-pd\x83\xBF\xA0\xF9\x8A^\x88bf\xE7\xAE"
digest == recovered_digest
#=> true