我正在尝试在NSString上写一个快速类别,以base64编码字符串的内容。除了在生成的字符串的尾端显示的额外字符外,一切似乎都没问题。任何人都可以解释为什么以下代码产生下面的输出?
来源:
const char base64CharSet[64] = {
'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H',
'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P',
'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X',
'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f',
'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n',
'o', 'p', 'q', 'r', 's', 't', 'u', 'v',
'w', 'x', 'y', 'z', '0', '1', '2', '3',
'4', '5', '6', '7', '8', '9', '+', '/'
};
const char *input = "Hello, World!";
int length = strlen(input);
int outlen = (length / 3) * 4;
int modlen = length % 3;
int rawlen = length - modlen;
if (modlen != 0)
outlen += 4;
char output[outlen];
char inbuf[3], outbuf[4];
int inpos = 0, outpos = 0;
for (outpos = 0, inpos = 0; inpos < rawlen; inpos += 3) {
for (int i = 0; i < 3; i++) {
int j = inpos + i;
inbuf[i] = j < length ? input[j] : 0;
}
outbuf[0] = (inbuf[0] & 0xFC) >> 2;
outbuf[1] = ((inbuf[0] & 0x03) << 4) | ((inbuf[1] & 0xF0) >> 4);
outbuf[2] = ((inbuf[1] & 0x0F) << 2) | ((inbuf[2] & 0xC0) >> 6);
outbuf[3] = (inbuf[2] & 0x3F);
output[outpos++] = base64CharSet[outbuf[0]];
output[outpos++] = base64CharSet[outbuf[1]];
output[outpos++] = base64CharSet[outbuf[2]];
output[outpos++] = base64CharSet[outbuf[3]];
}
if (modlen > 0) {
char modbuf[3] = {0, 0, 0};
for (int i = 0; i < modlen; i++) {
int j = rawlen + i;
modbuf[i] = input[j];
}
outbuf[0] = (modbuf[0] & 0xFC) >> 2;
outbuf[1] = ((modbuf[0] & 0x03) << 4) | ((modbuf[1] & 0xF0) >> 4);
outbuf[2] = ((modbuf[1] & 0x0F) << 2) | ((modbuf[2] & 0xC0) >> 6);
outbuf[3] = (modbuf[2] & 0x3F);
output[outpos++] = base64CharSet[outbuf[0]];
output[outpos++] = base64CharSet[outbuf[1]];
output[outpos++] = modlen == 2 ? base64CharSet[outbuf[2]] : '=';
output[outpos++] = '=';
}
NSLog(@"Input: '%s', Length: %zd", input, strlen(input));
NSLog(@"Output: '%s', Length: %zd, Expected Length: %d", output, strlen(output), outlen);
输出:
2013-03-19 14:46:51.568 Sandbox[19195:c07] Input: 'Hello, World!', Length: 13
2013-03-19 14:46:51.569 Sandbox[19195:c07] Output: 'SGVsbG8sIFdvcmxkIQ==wä]', Length: 23, Expected Length: 20
答案 0 :(得分:4)
2013-03-19 14:46:51.569 Sandbox[19195:c07] Output: 'SGVsbG8sIFdvcmxkIQ==wä]', Length: 23, Expected Length: 20
最后的goober是因为你没有NULL终止输出缓冲区。 C字符串要求字符串中最后一个字符后面的字符为0(全0位,而不是ASCII“0”:)。
...附加到完整数组会引发异常......
欢迎来到C!这种语言类似于用剪刀跑。即使你跌倒了,也可能不会受伤。可能不会。
在这种情况下,您实际上并没有写入NULL字节,因此,C字符串的打印只是读取字符串数组后堆栈上发生的任何事情。我没有审核代码以确定缓冲区是否是正确的大小。
假设你的所有数学都是正确的,你可以将缓冲区分配为比编码所需的长一个字节,然后在那里删除终结符。
char output[outlen + 1];
output[outlen + 1] = 0;