受到this question答案的“编码方案”的启发,我在Python中实现了自己的编码算法。
这是它的样子:
import random
from math import pow
from string import ascii_letters, digits
# RFC 2396 unreserved URI characters
unreserved = '-_.!~*\'()'
characters = ascii_letters + digits + unreserved
size = len(characters)
seq = range(0,size)
# Seed random generator with same randomly generated number
random.seed(914576904)
random.shuffle(seq)
dictionary = dict(zip(seq, characters))
reverse_dictionary = dict((v,k) for k,v in dictionary.iteritems())
def encode(n):
d = []
n = n
while n > 0:
qr = divmod(n, size)
n = qr[0]
d.append(qr[1])
chars = ''
for i in d:
chars += dictionary[i]
return chars
def decode(str):
d = []
for c in str:
d.append(reverse_dictionary[c])
value = 0
for i in range(0, len(d)):
value += d[i] * pow(size, i)
return value
我遇到的问题是编码和解码非常大的整数。例如,这是当前编码和解码大量数字的方式:
s = encode(88291326719355847026813766449910520462)
# print s -> "3_r(AUqqMvPRkf~JXaWj8"
i = decode(s)
# print i -> "8.82913267194e+37"
# print long(i) -> "88291326719355843047833376688611262464"
最高的16个位置完美匹配,但在此之后,这个数字偏离原来的位置。
我认为在使用Python进行划分时,这是一个极大整数精度的问题。有没有办法绕过这个问题?或者是否有其他我不知道的问题?
答案 0 :(得分:4)
问题在于这一行:
value += d[i] * pow(size, i)
您好像在这里使用math.pow
而不是内置的pow
方法。它返回一个浮点数,因此您丢失了大数字的准确性。您应该使用内置的pow
或**
运算符,或者更好的是,将基数的当前功效保存在整数变量中:
def decode(s):
d = [reverse_dictionary[c] for c in s]
result, power = 0, 1
for x in d:
result += x * power
power *= size
return result
现在它给了我以下结果:
print decode(encode(88291326719355847026813766449910520462))
# => 88291326719355847026813766449910520462