编码特殊字符时,Base64不起作用

时间:2016-12-21 14:17:34

标签: c++ c encoding base64

我正在使用我在GitHub Link to b64.c上找到的base64库,当我编码ascii字符串时它可以正常工作但是当我尝试编码二进制文件(如图像)时,它不会工作。下面是我用来读取文件的代码片段。

hello.txt的

héllo

hello.txt只有一个特殊字符。如果特殊字符只是一个普通字符,它就可以正常工作。

的main.c

int main()
{
    FILE *fp=NULL;
    char *buf=NULL, *str1="héllo", *str2="hello";
    int i=0;
    size_t fsize=0, bytes_read=0;

    fp=fopen("hello.txt", "rb");
    fseek(fp, 0, SEEK_END);
    fsize=ftell(fp);
    rewind(fp);
    buf=(char*)malloc(sizeof(char)*(fsize));
    //buf[fsize]='\0';
    bytes_read=fread(buf, 1, fsize, fp);
    if( bytes_read!=fsize ) exit(-1);
    fclose(fp);
    printf("encoded=%s\n", b64_encode((const unsigned char*)buf, fsize));

    getchar();
    return 0;
}

encode.c //具有函数base64_encode

char *b64_encode(const unsigned char* src, size_t len)
{
    int i=0, j=0;
    char *enc=NULL;
    size_t size=0;
    unsigned char buf[4], tmp[3];

    // alloc
    enc=(char*)malloc(0);
    if( enc==NULL )
    {
        perror("enc");

        return NULL;
    }

    while( len-- )
    {
        tmp[i++]=*(src++);
        if( i==3 )
        {
            buf[0]=( tmp[0]&0xfc )>>2;
            buf[1]=( ( tmp[0]&0x03 )<<4 )+( ( tmp[1]&0xf0 )>>4 );
            buf[2]=( ( tmp[1]&0x0f )<<2 )+( ( tmp[1]&0xc0 )>>6 );
            buf[3]=tmp[2]&0x3f;

            /*
             * alloc 4 bytes for 'enc' and then translate
             * each encoded buffer part by index from
             * the base64 table into 'enc' unsigned char array
            */
            enc=(char*)realloc(enc, size+4);
            for( i=0; i<4; ++i )
            {
                enc[size++]=b64_table[buf[i]];
            }

            // reset index
            i=0;
        }
    }

    if( i>0 )
    {
        // fill 'tmp' with '\0' at most 3 times
        for( j=i; j<3; ++j )
        {
            tmp[j]='\0';
        }

        // perform same codes as above
        buf[0]=( tmp[0]&0xfc )>>2;
        buf[1]=( ( tmp[0]&0x03 )<<4 )+( ( tmp[1]&0xf0 )>>4 );
        buf[2]=( ( tmp[1]&0x0f )<<2 )+( ( tmp[1]&0xc0 )>>6 );
        buf[3]=tmp[2]&0x3f;

        // same write to enc with new allocation
        for( j=0; j<i+1; ++j )
        {
            enc=(char*)realloc(enc, size+1);
            enc[size++]=b64_table[buf[j]];
        }

        while( ( i++ )<3 )
        {
            enc=(char*)realloc(enc, size+1);
            enc[size++]='=';
        }
    }

    enc=(char*)realloc(enc, size+1);
    enc[size]='\0';

    return enc;
}

按计划输出

aOnsbG9=
使用utf-8

保存后

aMPpbGxv  

预期输出

aMOpbGxv

PS。我以二进制文件的形式阅读该文件,因为它有特殊的字符,后来我想读取二进制数据,如图像或视频。

1 个答案:

答案 0 :(得分:3)

问题在于函数b64_encode:

buf[2]=( ( tmp[1]&0x0f )<<2 )+( ( tmp[1]&0xc0 )>>6 );

应该是

buf[2]=( ( tmp[1]&0x0f )<<2 )+( ( tmp[2]&0xc0 )>>6 );

请务必在两种情况下解决此问题。