通过TCP / IP传输浮点值和数据损坏

时间:2010-09-20 16:55:08

标签: sockets tcp floating-point corruption packets

我有一个非常奇怪的错误。

我有两个通过TCP / IP进行通信的应用程序。

应用程序A是服务器,应用程序B是客户端。

应用程序A每100毫秒向应用程序B发送一堆浮点值。

错误如下:应用程序B收到的某些浮点值有时与应用程序A传输的值不同。

最初,我认为以太网或TCP / IP驱动程序存在问题(某种数据损坏)。然后我在其他Windows机器上测试了代码,但问题仍然存在。

然后我测试了Linux上的代码(Ubuntu 10.04.1 LTS),问题仍然存在!!!

这些值会在发送之前及收到之后记录。

代码非常简单:消息协议有一个4字节的标题,如下所示:

//message header
struct MESSAGE_HEADER {
    unsigned short type;
    unsigned short length;
};

//orientation message
struct ORIENTATION_MESSAGE : MESSAGE_HEADER
{
  float azimuth;
  float elevation;
  float speed_az;
  float speed_elev;
};

//any message
struct MESSAGE : MESSAGE_HEADER {
    char buffer[512];
};

//receive specific size of bytes from the socket
static int receive(SOCKET socket, void *buffer, size_t size) {
    int r;
    do {
        r = recv(socket, (char *)buffer, size, 0);
        if (r == 0 || r == SOCKET_ERROR) break;
        buffer = (char *)buffer + r;
        size -= r;
    } while (size);
    return r;
}

//send specific size of bytes to a socket
static int send(SOCKET socket, const void *buffer, size_t size) {
    int r;
    do {
        r = send(socket, (const char *)buffer, size, 0);
        if (r == 0 || r == SOCKET_ERROR) break;
        buffer = (char *)buffer + r;
        size -= r;
    } while (size);
    return r;
}

//get message from socket
static bool receive(SOCKET socket, MESSAGE &msg) {
    int r = receive(socket, &msg, sizeof(MESSAGE_HEADER));
    if (r == SOCKET_ERROR || r == 0) return false;
    if (ntohs(msg.length) == 0) return true;
    r = receive(socket, msg.buffer, ntohs(msg.length));
    if (r == SOCKET_ERROR || r == 0) return false;
    return true;
}

//send message
static bool send(SOCKET socket, const MESSAGE &msg) {
    int r = send(socket, &msg, ntohs(msg.length) + sizeof(MESSAGE_HEADER));
    if (r == SOCKET_ERROR || r == 0) return false;
    return true;
}

当我收到消息'orientation'时,有时'azimuth'值与服务器发送的值不同!

数据不应该一直都是一样的吗? TCP / IP不保证数据的传输没有损坏吗?可能是数学协处理器中的异常会影响TCP / IP堆栈吗?我首先收到少量字节(4个字节)然后收到消息正文?

是一个问题

编辑:

问题在于endianess交换例程。下面的代码交换特定float的endianess,然后再次交换它并打印字节:

#include <iostream>
using namespace std;

float ntohf(float f)
{
    float r;
    unsigned char *s = (unsigned char *)&f;
    unsigned char *d = (unsigned char *)&r;
    d[0] = s[3];
    d[1] = s[2];
    d[2] = s[1];
    d[3] = s[0];
    return r;
}

int main() {
    unsigned long l = 3206974079;
    float f1 = (float &)l;
    float f2 = ntohf(ntohf(f1));
    unsigned char *c1 = (unsigned char *)&f1;
    unsigned char *c2 = (unsigned char *)&f2;
    printf("%02X %02X %02X %02X\n", c1[0], c1[1], c1[2], c1[3]);
    printf("%02X %02X %02X %02X\n", c2[0], c2[1], c2[2], c2[3]);
    getchar();
    return 0;
}

输出结果为:

7F 8A 26 BF 7F CA 26 BF

即。浮点赋值可能会对值进行标准化,从而产生与原始值不同的值。

欢迎提出任何意见。

EDIT2:

谢谢大家的回复。似乎问题是当通过'return'语句返回时,交换的浮点数被推入CPU的浮点堆栈中。然后调用者从堆栈中弹出值,该值是四舍五入的,但它是交换的浮点数,因此舍入会使值变得混乱。

2 个答案:

答案 0 :(得分:3)

TCP尝试提供未更改的字节,但除非计算机具有类似的CPU和操作系统,否则无法保证一个系统上的浮点表示与另一个系统上的浮点表示相同。您需要一种机制来确保这一点,例如XDR或Google的protobuf。

答案 1 :(得分:0)

您正在通过网络发送二进制数据,使用实现定义的填充结构布局,因此只有在为应用程序A和应用程序B使用相同的硬件,操作系统和编译器时才会有效。

如果没关系,我看不出你的代码有什么问题。一个潜在的问题是你使用ntohs来提取消息的长度,而长度是总长度减去标题长度,所以你需要确保正确设置它。它需要以

完成
msg.length = htons(sizeof(ORIENTATION_MESSAGE) - sizeof(MESSAGE_HEADER));

但是您没有显示设置消息的代码......