跨平台支持sprintf' -Flag

时间:2017-06-13 14:03:51

标签: c printf cross-platform number-formatting sus

Single UNIX Specification Version 2指定sprintf的格式' - 标记行为为:

  

十进制转换结果的整数部分(%i%d%u%f%g%G)将被格式化为数千'分组字符 [1]

我无法在规范中找到格式' - 标记。 g++ even warns

  

ISO C ++ 11不支持' printf标志

即使在Visual C中警告也不会识别该标志; printf("%'d", foo) outputs

  

' d

我希望能够编写使用格式为' - flag的行为的符合C标准的代码。因此,我正在寻找以下其中一个答案:

  1. 格式' - 标志
  2. 的C标准规范
  3. 跨平台兼容推断gcc的格式' - flag
  4. 证明无法进行跨平台推断

1 个答案:

答案 0 :(得分:2)

标准C不直接提供格式化功能,但它确实能够在特定于语言环境的基础上检索格式应该是什么的规范。因此,您需要检索区域设置的正确格式规范,然后将其用于格式化您的数据(但即使这样,它也有点不重要)。例如,这是用于格式化long数据的版本:

#include <stdlib.h>
#include <locale.h>
#include <string.h>
#include <limits.h>

static int next_group(char const **grouping) {
    if ((*grouping)[1] == CHAR_MAX)
        return 0;
    if ((*grouping)[1] != '\0')
        ++*grouping;
    return **grouping;
}

size_t commafmt(char   *buf,            /* Buffer for formatted string  */
                int     bufsize,        /* Size of buffer               */
                long    N)              /* Number to convert            */
{
    int i;
    int len = 1;
    int posn = 1;
    int sign = 1;
    char *ptr = buf + bufsize - 1;

    struct lconv *fmt_info = localeconv();
    char const *tsep = fmt_info->thousands_sep;
    char const *group = fmt_info->grouping;
    // char const *neg = fmt_info->negative_sign;
    size_t sep_len = strlen(tsep);
    size_t group_len = strlen(group);
    // size_t neg_len = strlen(neg);
    int places = (int)*group;

    if (bufsize < 2)
    {
ABORT:
        *buf = '\0';
        return 0;
    }

    *ptr-- = '\0';
    --bufsize;
    if (N < 0L)
    {
        sign = -1;
        N = -N;
    }

    for ( ; len <= bufsize; ++len, ++posn)
    {
        *ptr-- = (char)((N % 10L) + '0');
        if (0L == (N /= 10L))
            break;
        if (places && (0 == (posn % places)))
        {
            places = next_group(&group);
            for (int i=sep_len; i>0; i--) {
                *ptr-- = tsep[i-1];
                if (++len >= bufsize)
                    goto ABORT;
            }
        }
        if (len >= bufsize)
            goto ABORT;
    }

    if (sign < 0)
    {
        if (len >= bufsize)
            goto ABORT;
        *ptr-- = '-';
        ++len;
    }

    memmove(buf, ++ptr, len + 1);
    return (size_t)len;
}

#ifdef TEST
#include <stdio.h>

#define elements(x) (sizeof(x)/sizeof(x[0]))

void show(long i) {
    char buffer[32];

    commafmt(buffer, sizeof(buffer), i);
    printf("%s\n", buffer);
    commafmt(buffer, sizeof(buffer), -i);
    printf("%s\n", buffer);
}


int main() {

    long inputs[] = {1, 12, 123, 1234, 12345, 123456, 1234567, 12345678 };

    for (int i=0; i<elements(inputs); i++) {
        setlocale(LC_ALL, "");
        show(inputs[i]);
    }
    return 0;
}

#endif

这确实有一个错误(但我认为这个错误很小)。在两个补码硬件上,它无法正确转换最负数,因为它试图将负数转换为等效的正数,而N = -N;在两个补码中,除非您将其推广到更大的类型,否则最大负数不会有相应的正数。解决这个问题的一种方法是通过提升相应的无符号类型的数字(但它有点不重要)。

为其他整数类型实现相同的操作是相当简单的。对于浮点类型来说,工作要多一些。正确转换浮点类型(即使没有格式化)也足够了,对于它们来说,我至少考虑使用类似sprintf之类的东西进行转换,然后将格式插入到生成的字符串中。