我有一个带有“消息”的二进制文件,我正在尝试使用结构符合正确变量中的字节。在我的例子中,我使用了两种类型的消息:Tmessage和Amessage。
#include <iostream>
#include <fstream>
#include <stdlib.h>
#include <string>
#include <iomanip>
using namespace std;
struct Tmessage
{
unsigned short int Length;
char MessageType;
unsigned int Second;
};
struct Amessage
{
unsigned short int Length;
char MessageType;
unsigned int Timestamp;
unsigned long long int OrderReferenceNumber;
char BuySellIndicator;
unsigned int Shares;
char Stock[6];
unsigned int Price;
};
int main(int argc, char* argv[])
{
const char* filename = argv[1];
fstream file(filename, ios::in | ios::binary);
unsigned long long int pi = 0;
if(file.is_open()){ cout << filename << " OPENED" << endl; }
else { cout << "FILE NOT OPENED" << endl; }
unsigned char* memblock;
memblock = new unsigned char[128];
file.read((char *)memblock, 128);
cout << "BINARY DATA" << endl;
while (pi < 128)
{
cout << setw(2) << hex << static_cast<unsigned int>(memblock[pi]) << " ";
pi++;
if((pi%16)==0) cout << endl;
}
unsigned int poi = 0;
Tmessage *Trecord;
Trecord = (Tmessage *)memblock;
cout << "Length: " << hex << (*Trecord).Length << endl;
cout << "Message type: " << hex << (*Trecord).MessageType << endl;
cout << "Second: " << hex << (*Trecord).Second << endl;
poi = poi + 7; cout << endl;
Amessage *Arecord;
Arecord = (Amessage *)(memblock+poi);
cout << "Length: " << hex << (*Arecord).Length << endl;
cout << "Message type: " << hex << (*Arecord).MessageType << endl;
cout << "Timestamp: " << hex << (*Arecord).Timestamp << endl;
cout << "OrderReferenceNumber: " << hex << (*Arecord).OrderReferenceNumber << endl;
cout << "BuySellIndicator: " << hex << (*Arecord).BuySellIndicator << endl;
cout << "Shares: " << hex << (*Arecord).Shares << endl;
cout << "Stock: " << hex << (*Arecord).Stock << endl;
cout << "Price: " << hex << (*Arecord).Price << endl;
delete memblock;
file.close();
cout << endl << "THE END" << endl;
return 0;
}
运行程序时的输出:
stream OPENED
BINARY DATA
0 5 54 0 0 62 72 0 1c 41 0 f 42 40 0 0
0 0 0 4 2f 76 53 0 0 3 e8 53 50 59 20 20
20 0 11 5 d0 0 1c 41 0 f 42 40 0 0 0 0
0 4 2f 78 42 0 0 3 e8 53 50 59 20 20 20 0
10 f7 5c 0 1c 41 0 f 42 40 0 0 0 0 0 4
2f 90 53 0 0 1 2c 53 50 59 20 20 20 0 11 2
b0 0 5 54 0 0 62 76 0 d 44 14 25 78 80 0
0 0 0 0 4 2f 90 0 d 44 14 25 78 80 0 0
Length: 500
Message type: T
Second: 726200
Length: 1c00
Message type: A
Timestamp: 40420f
OrderReferenceNumber: 53762f0400000000
BuySellIndicator:
Shares: 20595053
Stock:
Price: 420f0041
THE END
程序将字节正确放置在Tmessage结构中。
(0 5 54 0 0 62 72)
但是,在解析Amessage时会发生一些事情
(0 1c 41 0 f 42 40 0 0 0 0 0 4 2f 76 53 0 0 3 e8 53 50 59 20 20 20 0 11 5 d0)
Lenght,MessageType和Timestamp是正确的,但OrderReferenceNumber包含属于BuySellIndicator的“53”字节,然后另一个变量不正确。
正确的A消息输出应为:
长度:1c 0
消息类型:41
时间戳:40 42 f 0
OrderReferenceNumber:76 2f 4 0 0 0 0 0
BuySellIndicator:53
股票:e8 3 0 0
库存:53 50 59 20 20 20
价格:d0 5 11 0
这2个问题: a)为什么OrderReferenceNumber包含“53”字节? b)我认为“char Stock [6]”不起作用,因为在Share的字节和Price的字节之间有超过6个字节。如何将6个字节放入char矢量或字符串?
注意:我知道我必须交换字节,因为二进制数据是big-endian。这就是不应该交换“股票”的原因。 非常感谢您的帮助!亲切的问候,
答案 0 :(得分:4)
结构的数据成员之间可能存在未命名的填充字节。
为了以可移植的方式从文件中读取二进制数据,您应该单独阅读该结构的每个成员。
您还应该使用<cstdint>
中指定的确切宽度类型(如果您的标准库还没有,则Boost具有此标头的实现);这样您就可以确保数据成员的大小与消息中字段的大小相匹配。
答案 1 :(得分:3)
编译器可能在结构的成员之间插入填充字节。你可以解决这个问题的一种方法是使用pragma pack。请注意,这是非标准的,但它适用于g ++和visual C ++。
#pragma pack (push, 1)
struct Amessage
{
unsigned short int Length;
char MessageType;
unsigned int Timestamp;
unsigned long long int OrderReferenceNumber;
char BuySellIndicator;
unsigned int Shares;
char Stock[6];
unsigned int Price;
};
#pragma pack (pop)
上面代码中发生的事情是:pragma包告诉编译器你不希望它插入填充以使它能够执行对结构成员的对齐访问。推/弹的东西是这样你可以有嵌套的#pragma包(例如,当包含头文件时),并有办法回到以前设置的包选项。
请参阅MSDN以获得可能比我能给出的解释更好的解释。 http://msdn.microsoft.com/en-us/library/2e70t5y1%28VS.80%29.aspx