我有正整数的3个基本表示:
我希望能够以最有效的方式在所有3个表示中的数字之间进行转换。即实现以下6个功能:
unsigned long int Binary2Dec(const string & Bin) {}
unsigned long int Hex2Dec(const string & Hex) {}
string Dec2Hex(unsigned long int Dec) {}
string Binary2Hex(const string & Bin) {}
string Dec2Binary(unsigned long int Dec) {}
string Hex2Binary(const string & Hex) {}
每种方法最有效的方法是什么?我可以使用C和C ++,但不能提升。
编辑:“效率”是指时间效率:最短的执行时间。
答案 0 :(得分:8)
正如其他人所指出的那样,我会从sscanf()
,printf()
和/或strtoul()
开始。它们对于大多数应用程序来说足够快,并且它们不太可能有bug。但是,我会说,这些函数比你想象的更通用,因为它们必须处理非ASCII字符集,数字表示在任何基数等等。对于某些域,可以击败库函数。
因此,先测量一下,如果这些转换的性能确实存在问题,那么:
1)在某些应用程序/域中,某些数字经常出现,例如零,100,200,19.95,可能是如此常见以至于优化函数以使用一堆if()语句转换这些数字是有意义的,然后回到通用库函数。 2)如果最常见的100个数字使用表查找,然后回退到库函数。请记住,大型表可能不适合您的缓存,并且可能需要对共享库进行多次间接,因此请仔细测量这些内容,以确保不会降低性能。
您可能还想查看boost lexical_cast函数,但根据我的经验,后者与旧的C函数相比较。
很多人都这样说过,值得一遍又一遍地重复:在你有证据证明这些转换有问题之前,不要优化这些转换。如果你做了优化,测量你的新实现以确保它更快和确保你有自己版本的大量单元测试,因为你将引入错误: - (
答案 1 :(得分:4)
此外,如果您对如何实施感兴趣,可以查看source code的glibc, the GNU C Library。
答案 2 :(得分:3)
为什么这些例程必须如此节省时间?那种说法总是让我怀疑。你确定像strtol()这样明显的转换方法太慢,或者你可以做得更好吗?系统功能通常非常有效。它们有时较慢,无法支持通用性和错误检查,但您需要考虑如何处理错误。如果bin
参数的字符不是'0'和'1',那么呢?中止?传播大量错误?
为什么使用“Dec”来表示内部表示? Dec,Hex和Bin应该用于表示字符串表示。 unsigned long
没有关于小数的小数。你在处理显示十进制数字的字符串吗?如果没有,你会让人混淆,并且会混淆更多。
二进制和十六进制文本格式之间的转换可以使用查找表快速有效地完成,但任何涉及十进制文本格式的内容都会更复杂。
答案 3 :(得分:2)
这取决于你所优化的内容,“高效”是什么意思?重要的是转换速度快,占用内存少,程序员时间少,其他程序员阅读代码的次数少WTFs,还是什么?
为了便于阅读和实施,您至少应该通过调用Dec2Hex()
来实现Dec2Binary()
和strotul()
。这使得它们成为单行,这对于该词的至少一些上述解释非常有效。
答案 4 :(得分:1)
听起来非常像一个家庭作业问题,但到底是什么......
简短的回答是从long int转换为字符串使用两个查找表。每个表应该有256个条目。一个字节映射到十六进制字符串:0 - > “00”,1 - > “01”等。另一个将字节映射到位串:0 - > “00000000”,1 - > “00000001”。
然后对于long int中的每个字节,您只需要查找正确的字符串,然后将它们连接起来。
要将字符串转换回long,您只需将十六进制字符串和位字符串转换回十进制数,方法是将每个字符的数值乘以16或2的相应幂,然后将结果相加。 / p>
编辑:您也可以通过二进制搜索找到正确的字符串,使用相同的查找表进行向后转换。这将采用log(256)= 8比较你的字符串。不幸的是,我没有时间进行分析,比较字符串是否比乘法和添加整数要快得多。
答案 5 :(得分:1)
让我们暂时考虑一半的任务 - 从字符串化的基数n转换为无符号长整数,其中n是2的幂(二进制的基数为2,十六进制的基数为16)。
如果您的输入是理智的,那么这项工作只不过是比较,减法,转移和一个或每个数字。如果你的意见不是很明智,那就是它变得丑陋的地方,不是吗?做转换超快并不难。在任何情况下都做得好是挑战。
因此,我们假设您的输入是理智的,那么转换的核心就是:
unsigned long PowerOfTwoFromString(char *input, int shift)
{
unsigned long val = 0;
char upperLimit = 'a' + (1 << shift)
while (*input) {
char c = tolower(*input++);
unsigned long digit = (c > 'a' && c < upperLimit) ? c - 'a' + 10 : c - '0';
val = (val << shift) | digit;
}
return val;
}
#define UlongFromBinaryString(str) PowerOfTwoFromString(str, 1)
#define UlongFromHexString(str) PowerOfTwoFromString(str, 4)
看看这有多容易?并且它会在不合理的输入上失败。你的大部分工作都是为了让你的输入得到理智而不是表现。
现在,此代码利用了两次移位的功能。它很容易扩展到基座4,基座8,基座32等。它不适用于两个基座的非功率。对于那些,你的数学必须改变。你得到了
val = (val * base) + digit
在概念上对于这组操作是相同的。基数的乘法将等同于移位。所以我很可能会使用完全通用的例程。并在清理输入的同时清理代码。那时候,strtoul可能是你最好的选择。这是strtoul a version的链接。几乎所有的工作都是处理边缘条件 - 这应该让你知道你应该集中注意力的地方:正确,有弹性的代码。与节省的费用相比,使用位移的节省将是最小的,而不会因输入错误而崩溃。
答案 6 :(得分:0)
为什么不使用宏来将格式作为输入。如果你至少在C中。
#define TO_STRING( string, format, data) \
sprintf( string, "##format##", data)
// Int
TO_STRING(buf,%d,i);
// Hex ( Two char representation )
TO_STRING(buf,%02x,i);
// Binary
TO_STRING(buf,%b,i);
或者您可以直接使用sprintf:或者您可以使用多个宏。
#define INT_STRING( buf, data) \
sprintf( buf, "%d", data)
#define HEX_STRING( buf, data) \
sprintf( buf, "%x", data)
#define BIN_TO_STRING( buf, data) \
sprintf( buf, "%b", data)
BIN_TO_STRING( loc_buf, my_bin );