这个EBCDIC到ASCII转换背后的基本原理是什么?

时间:2016-02-18 20:39:07

标签: c char ascii ebcdic

我想了解这种转换究竟是如何发生的。

http://www8.cs.umu.se/~isak/Snippets/a2e.c

char sample[6] = "hello";

如果是示例文字hascii如何从ebcdic转换为{{1}},反之亦然?

编辑:我真的不需要转换字符串。我只是想知道这些表是如何构建的。

2 个答案:

答案 0 :(得分:2)

  

我只是想知道这些表是如何构建的。

ASCII中的

'0'代码值为48.
EBCDIC中的'0'代码值为240.

因此我们需要将表格映射到48到240和240到48。

转换'0'ASCII代码值为48. a2e[48]返回240EBCDIC代码为'0'

static unsigned char a2e[256] = {
    ...
    ...
    ...
    240,241,242,243,244,245,246,247,248,249,122, 94, 76,126,110,111,
    ...

现在使用240,字符'0'的EBCDIC代码。 e2a[240]返回48,即字符'0'的ASCII代码。

static unsigned char e2a[256] = {
     ...
     13 more rows
     ...
     48, 49, 50, 51, 52, 53, 54, 55, 56, 57,250,251,252,253,254,255
};

对所有其他常见字符执行此操作。将映射定义为其余的映射。 Recall ASCII仅定义128个字符,而EBCDIC定义256个。

其他

EBCDIC布局与某些punch cards有一些关系。

在两个字符集中,字符01,... 9都是连续的 - 需要在C中进行编码。

在两个集合中,大写和小写字母相差1位,因此可以编写以下代码(更好地使用C tolower()

int from_upper_to_lower(int code) {
  return code - 'A' + 'a`;
}

答案 1 :(得分:0)

可以使用表格在汇编程序中编写从一个字符集转换为另一个字符集的函数。

在C中,您可以将此字符串从ASCII转换为EBCDIC

char sample[6] = "hello";

以下方式

char * AsciiToEbcdic( char *s )
{
    for ( char *p = s; *p; ++p ) *p = a2e[( unsigned char )*p];

    return s;
} 

前提是该表可在函数中访问。

这是一个示范程序。

#include <stdio.h>

char * AsciiToEbcdic( char *s )
{
    static unsigned char a2e[256] = 
    {
          0,  1,  2,  3, 55, 45, 46, 47, 22,  5, 37, 11, 12, 13, 14, 15,
         16, 17, 18, 19, 60, 61, 50, 38, 24, 25, 63, 39, 28, 29, 30, 31,
         64, 79,127,123, 91,108, 80,125, 77, 93, 92, 78,107, 96, 75, 97,
        240,241,242,243,244,245,246,247,248,249,122, 94, 76,126,110,111,
        124,193,194,195,196,197,198,199,200,201,209,210,211,212,213,214,
        215,216,217,226,227,228,229,230,231,232,233, 74,224, 90, 95,109,
        121,129,130,131,132,133,134,135,136,137,145,146,147,148,149,150,
        151,152,153,162,163,164,165,166,167,168,169,192,106,208,161,  7,
         32, 33, 34, 35, 36, 21,  6, 23, 40, 41, 42, 43, 44,  9, 10, 27,
         48, 49, 26, 51, 52, 53, 54,  8, 56, 57, 58, 59,  4, 20, 62,225,
         65, 66, 67, 68, 69, 70, 71, 72, 73, 81, 82, 83, 84, 85, 86, 87,
         88, 89, 98, 99,100,101,102,103,104,105,112,113,114,115,116,117,
        118,119,120,128,138,139,140,141,142,143,144,154,155,156,157,158,
        159,160,170,171,172,173,174,175,176,177,178,179,180,181,182,183,
        184,185,186,187,188,189,190,191,202,203,204,205,206,207,218,219,
        220,221,222,223,234,235,236,237,238,239,250,251,252,253,254,255
    };

    for ( char *p = s; *p; ++p ) *p = a2e[( unsigned char )*p];

    return s;
} 

int main( void ) 
{
    char s[] = "@@@@@";

    printf( "\"%s\"\n", s );
    printf( "\"%s\"\n", AsciiToEbcdic( s ) );

    return 0;
}

它的输出是

"@@@@@"
"|||||"