c中的编码和解码文本

时间:2013-10-07 13:52:26

标签: c text encoding ascii decoding

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

FILE *inputFile;
FILE *outputFile;

int encodeBinary[4] = {0x00, 0x01, 0x02, 0x03};
char encodeChars[4] = {':', '@', '\n', ' '};

void encode(const char * inFile, const char * outFile)
{

    inputFile = fopen(inFile, "r");
    outputFile = fopen(outFile, "w");
    char lineBuffer[BUFSIZ];

    if(inputFile == NULL)
    {
        perror("Error while opening file.\n");
        exit(EXIT_FAILURE);
    }

    while(fgets(lineBuffer, sizeof(lineBuffer), inputFile))
    {
        for(int i = 0; lineBuffer[i] != 0; i++)
        {
            if(lineBuffer[i] == encodeChars[0])
            {
                fprintf(outputFile, "%d", encodeBinary[0]);
            }
            else if(lineBuffer[i] == encodeChars[1])
            {
                fprintf(outputFile, "%d", encodeBinary[1]);
            }
            else if(lineBuffer[i] == encodeChars[2])
            {
                fprintf(outputFile, "%d", encodeBinary[2]);
            }
            else if(lineBuffer[i] == encodeChars[3])
            {
                fprintf(outputFile, "%d", encodeBinary[3]);
            }
        }
    }

    fclose(inputFile);
    fclose(outputFile);

}

void decode(const char * inFile, const char * outFile)
{

    inputFile = fopen(inFile, "r");
    outputFile = fopen(outFile, "w");
    char lineBuffer[BUFSIZ];

    if(inputFile == NULL)
    {
        perror("Error while opening file.\n");
        exit(EXIT_FAILURE);
    }

    while(fgets(lineBuffer, sizeof(lineBuffer), inputFile))
    {
        for(int i = 0; lineBuffer[i] != 0; i++)
        {
            if(lineBuffer[i] == '0')
            {
                fprintf(outputFile, "%c", encodeChars[0]);
            }
            else if(lineBuffer[i] == '1')
            {
                fprintf(outputFile, "%c", encodeChars[1]);
            }
            else if(lineBuffer[i] == '2')
            {
                fprintf(outputFile, "%c", encodeChars[2]);
            }
            else if(lineBuffer[i] == '3')
            {
                fprintf(outputFile, "%c", encodeChars[3]);
            }
        }
    }

    fclose(inputFile);
    fclose(outputFile);

}


void commands(const char * command, const char * inputFile, const char * outputFile)
{
    if(strcmp(command, "encode") == 0)
    {
        encode(inputFile, outputFile);
    }
    else if(strcmp(command, "decode") == 0)
    {
        decode(inputFile, outputFile);
    }
}

void testValues(int argc, const char * argv[])
{
    if(argc == 4)
    {
        commands(argv[1], argv[2], argv[3]);
    }
    else
        printf("USAGE: ./encode [input_file] [output_file]\n");
}

//MAIN
int main(int argc, const char * argv[])
{

    testValues(argc, argv);

    return 0;
}
你好。我有这段代码。代码应该得到一个由字符组成的文本文件:@&#34; newline&#34;和&#34;空间&#34;。然后应该将这些字符转换为二进制,0,1,10,11。之后我还需要一种方法来解码回原始字符。我似乎无法弄清楚的是如何能够读取数字之间的差异,如果有001,我怎么知道我们正在谈论0,01而不是00,1。我在某处读到你可以使用按位运算来做到这一点?任何帮助表示赞赏!

所以,我稍微更改了我的代码。现在的问题是,当我存储值时,编码的文件与要编码的文件一样大。如何将值存储在文件中,以便将值存储为十六进制(或二进制),以使编码文件小于原始文件?

1 个答案:

答案 0 :(得分:1)

{0, 1, 10, 11};不是二进制数,它们是十进制数,这是C源代码中的默认数字格式。其他可能的数字基数为十六进制,使用前缀0x和八进制编写,使用前缀0编写。没有办法在标准C代码中编写二进制数(可能因为它们被认为难以为人类阅读)。

所以你需要做的就是用十六进制输入数字:

{0x00, 0x01, 0x02, 0x03}

该算法非常简单:

  • 从文件中读取一个字符。
  • encodeChars中搜索此字符的匹配项(应声明为const char [])。
  • 如果找到,请将其替换为“二进制”中的相应索引。
  • 解码是另一种方式,只需使用二进制作为查找表。
  • 如果性能很重要,请考虑使用二进制搜索来实现此功能。这是应该使用二进制搜索的理想示例(排序数据,没有重复)。

修改

我所说的是程序员自己的源代码中程序员的数字表示。这里只能使用十进制,十六进制和八进制。

还有用户的数字表示,我想这就是你要找的东西。这可以是你想要的任何东西。

最后有 CPU 的数字表示。他只想要二元而不是二元。

考虑一下:printf("%c", 0x41).

  • 程序员看到了十六进制41。
  • 用户看到字母A.
  • CPU看到类似“堆栈上的商店编号01000001。跳转到子程序。”

要将一些随机字节作为二进制数显示给用户,只需执行以下操作:

#include <stdint.h>

uint8_t data = 0x41;

for(uint8_t i=0; i<8; i++)
{
  if( (data & (1<<i)) > 0)
  {
    printf("1");
  }
  else
  {
    printf("0");
  }

}