UnicodeDecodeError:' utf-8'不能解码字节

时间:2017-11-09 05:58:07

标签: python c sockets character-encoding

我编写了一个简单的客户端/服务器套接字程序,其中服务器部分使用C语言,而客户端使用python。我非常能够将数据从客户端发送到服务器,但无法将响应消息/数据发送回python脚本..

server.c

#include<stdio.h>
#include<sys/socket.h>
#include<arpa/inet.h> //inet_addr
#include<unistd.h>
#include<string.h>
#include<stdlib.h>
int main(int argc , char *argv[])
{
    int socket_desc , new_socket , c, valread;
    struct sockaddr_in server, client ;
    char *message;
    char buffer[1024] = {0};
    char *hello = "Hello from server";
    //Create socket
    socket_desc = socket(AF_INET , SOCK_STREAM , 0);
    if (socket_desc == -1)
    {
        printf("Could not create socket");
    }

    //Prepare the sockaddr_in structure
    server.sin_family = AF_INET;
    server.sin_addr.s_addr = INADDR_ANY;
    server.sin_port = htons( 8888 );

    //Bind
    if( bind(socket_desc,(struct sockaddr *)&server , sizeof(server)) < 0)
    {
        puts("bind failed");
    }
    puts("bind done");

    //Listen
    listen(socket_desc , 3);

    //Accept and incoming connection
    puts("Waiting for incoming connections...");
    c = sizeof(struct sockaddr_in);
    new_socket = accept(socket_desc, (struct sockaddr *)&client, (socklen_t*)&c);
    if (new_socket<0)
    {
        perror("accept failed");
    }

    puts("Connection accepted\n");

    valread = read(new_socket, buffer, 1024);
    printf("%s\n", buffer);
 send(new_socket, hello, strlen(hello),0);
    printf("Socket: Sent data!\n");

    write(new_socket, "Some message", 1024);

    return 0;
}

每当我运行服务器和客户端时,我都可以连接它们并将数据发送到服务器,但客户端无法解码要发回的响应,并给我以下的回溯调用...

Sending "This is the message. It will be repeated."
Traceback (most recent call last):
  File "pythonclient.py", line 35, in <module>
    client_program()
  File "pythonclient.py", line 25, in client_program
    text += data.decode().strip()
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfb in position 44: invalid start byte

2 个答案:

答案 0 :(得分:2)

我测试了你的Client.py,看起来效果很好,但是当我发送十六进制0xfb时,程序就像那样粉碎了,所以我认为你的服务器部分发送的无效数据不在{{1}中格式。

我建议您输入如下调试代码:

utf-8

这样您就可以看到您发送的字节数并找到服务器发送的无效数据。

答案 1 :(得分:2)

write(new_socket, "Some message", 1024);

从&#34;一些消息&#34;小于1024字节的服务器将发送&#34;一些消息&#34;然后将垃圾数据发送到客户端,即在此消息缓冲区之后内存中的任何内容,直到达到1024字节的长度。垃圾数据包含无效的字节组合utf-8的可能性很高,在这种情况下,Python应用程序将无法将数据解码为UTF-8。