我有一串数字,我希望缩短以便在网址中使用。此字符串始终仅由数字组成。例如:9587661771112
理论上,将数字字符串加密为字母数字(0-9a-zA-Z)字符串应始终返回较短的结果,这就是我想要的。
我创建了一个执行以下操作的算法:
加密(string1 =数字输入字符串,string2 =字母数字返回字符串)
- 从string1中取出接下来的两个字符并将它们转换为数字,例如上面例子中的95
- 检查数字是否小于52(a-z和A-Z的组合长度)
- 如果是这样,添加(“abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ”)[编号]到 string2并向前跳2个字符
- 否则,将(“0123456789)[数字的第一位数字]添加到string2并向前跳转1个字符
在下一步中,数字将是58,依此类推。
通过一些调整,我得到的最短结果是:9587661771112> j9UQpjva
我的问题是,使用这种技术,结果可能会有很大差异。我也觉得这对我的问题不是一个干净的解决方案。
所以我需要一种加密算法,将一串数字转换成一个较短的大写字母,小写字母和数字字符串。它必须是可解密的,并且具有或多或少的一致结果。
知道如何实现这个目标吗?
解决方案:
string Chars = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";
string Base10To62(long N)
{
string R = "";
while (N != 0)
{
R += Chars[(int)(N % 62)];
N /= 62;
}
return R;
}
long Base62To10(string N)
{
long R = 0;
int L = N.Length;
for (int i = 0; i < L; i++)
{
R += Chars.IndexOf(N[i]) * (long)Math.Pow(62, i);
}
return R;
}
就像一个魅力:)
答案 0 :(得分:2)
解决方案:
string Chars = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";
private static string Base10To62(string S)
{
string R = "";
var N = long.Parse(S);
do { R += Chars[(int)(N % 0x3E)]; } while ((N /= 0x3E) != 0);
return R;
}
private static string Base62To10(string S)
{
long R = 0;
int L = S.Length;
for (int i = 0; i < L; i++) R += Chars.IndexOf(S[i]) * (long)(System.Math.Pow(0x3E, i));
return R.ToString();
}
答案 1 :(得分:1)
Linq版本为62到10,只是为了好玩:
long Base62To10(string N)
{
return N.Select((t, i) => Chars.IndexOf(t)*(long) Math.Pow(62, i)).Sum();
}
答案 2 :(得分:1)
如果你可以再添加两个字符来使它更好,甚至64,那么我可以在这里描述一个简单,快速的算法。
将数字编码为三位或四位代码,如下所示:
0: 000
1: 001
2: 010
3: 011
4: 100
5: 101
6: 1100
7: 1101
8: 1110
9: 1111
这是一个前缀代码,这意味着你可以查看前三位来判断你是否需要使用第四位。如果作为整数的前三位大于5,则得到另一位。所以解码将是:
get three bits as n
if n < 6
the result is n + '0'
else
n = (n << 1) + one more bit
the result is n - 6 + '0'
然后,这些位简单地一次存储在64个允许字符之一中。
如果您不知道有多少位数,则会出现问题,因为如果在最后一个字符中未使用四位或五位,则会出现歧义。在这种情况下,代码可以简单地更改为:
0: 000
1: 001
2: 010
3: 011
4: 100
5: 1010
6: 1011
7: 1100
8: 1101
9: 1110
eom: 1111
它需要更多的位,但提供了一个明确的消息结束标记。
对于第一个示例,您将平均每个字符存储1.76位数。对于第二个示例,每个字符1.71位数,少于eom标记的一些数量,具体取决于您一次编码的位数。
如果你真的只能使用62个字符,那么我需要多考虑一下。
<强>更新强>
快速查看RFC 1738表示可以在网址中使用更多字符:
lowalpha = "a" | "b" | "c" | "d" | "e" | "f" | "g" | "h" |
"i" | "j" | "k" | "l" | "m" | "n" | "o" | "p" |
"q" | "r" | "s" | "t" | "u" | "v" | "w" | "x" |
"y" | "z"
hialpha = "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "I" |
"J" | "K" | "L" | "M" | "N" | "O" | "P" | "Q" | "R" |
"S" | "T" | "U" | "V" | "W" | "X" | "Y" | "Z"
alpha = lowalpha | hialpha
digit = "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" |
"8" | "9"
safe = "$" | "-" | "_" | "." | "+"
extra = "!" | "*" | "'" | "(" | ")" | ","
unreserved = alpha | digit | safe | extra
所以在你的套装中添加$和_会使它成为64。