我正在处理来自服务提供商的二进制数据。我使用C ++通过HTTP请求订阅这些数据。 我不时地从这个提供者那里得到一个HTML有效载荷。 HTML有效负载实际上是二进制数据,如下所示:
! ¦ô¿Âˤ ÍÌL? Àÿ Àÿ¥ š™©@ Àÿ Àÿ
或! H·ô¿Âˤ ÍÌL? Àÿ333?¥ š™©@ Àÿff¦@
我想使用我得到的数据进行模拟。为此,我在字符串中硬编码数据并启动将使用这些字符串的程序。
std::string input = "! ¦ô¿Âˤ ÍÌL? Àÿ Àÿ¥ š™©@ Àÿ Àÿ"
我遇到的第一个问题是我必须逃避\n
之类的所有字符。但我不知道如何逃避\0
。此外,我有这个错误消息,这可能是由于我没有正确地逃避文件结束字符的事实:
Error 3 fatal error C1004: unexpected end-of-file found
所以主要的问题是:文件结尾字符是什么样的,我怎么能逃脱呢?
然后,是否有linux命令或从二进制文件中获取二进制数据的方法,并使用\
转义所有特殊字符,然后我只是将其粘贴到我的C ++代码中。
最后,我想将所有不同的有效负载放在二进制文件中,这样我就可以使用这个文件启动我的模拟了。问题是我不知道如何分离不同的有效载荷,因为只是进入下一行不会起作用,因为它将被解释为随机字符(并且有效载荷没有固定大小) 。我不知道使用什么样的分隔符。
答案 0 :(得分:14)
您可以将有效负载写入文件,并使用std::ifstream
进行读取。这将允许您更改有效负载而无需重新编译。
如果你真的想把它存储为二进制数据,你可以使用一个char数组,并像这样初始化它:
const unsigned char raw_data[] = {
0x21, 0x20, 0xc2, 0xa6, 0xc3, 0xb4, 0xc2, 0xbf,
0xc3, 0x82, 0xc3, 0x8b, 0xc2, 0xa4, 0x20, 0xc3,
0x8d, 0xc3, 0x8c, 0x4c, 0x3f, 0x20, 0x20, 0xc3,
0x80, 0xc3, 0xbf, 0x20, 0x20, 0xc3, 0x80, 0xc3,
0xbf, 0xc2, 0xa5, 0x20, 0xc5, 0xa1, 0xe2, 0x84,
0xa2, 0xc2, 0xa9, 0x40, 0x20, 0x20, 0xc3, 0x80,
0xc3, 0xbf, 0x20, 0x20, 0xc3, 0x80, 0xc3, 0xbf,
0x60, 0x20, 0x6f, 0x72, 0x20, 0x60, 0x21, 0x20,
0x48, 0xc2, 0xb7, 0xc3, 0xb4, 0xc2, 0xbf, 0xc3,
0x82, 0xc3, 0x8b, 0xc2, 0xa4, 0x20, 0xc3, 0x8d,
0xc3, 0x8c, 0x4c, 0x3f, 0x20, 0x20, 0xc3, 0x80,
0xc3, 0xbf, 0x33, 0x33, 0x33, 0x3f, 0xc2, 0xa5,
0x20, 0xc5, 0xa1, 0xe2, 0x84, 0xa2, 0xc2, 0xa9,
0x40, 0x20, 0x20, 0xc3, 0x80, 0xc3, 0xbf, 0x66,
0x66, 0xc2, 0xa6, 0x40, 0x0a,
};
std::string data(
reinterpret_cast< const char* >(raw_data),
reinterpret_cast< const char* >(raw_data) + sizeof(raw_data));
哦,顺便说一句,我使用以下简单的Python代码将您的有效负载转换为缓冲区:
#!/usr/bin/python
def convert_file(path, stream):
data = open(path, 'rb').read()
stream.write('const unsigned char raw_data[] = {')
for i, char in enumerate(data):
if i % 8 == 0:
stream.write('\n ')
stream.write(' 0x%02x,' % (ord(char),))
stream.write('\n};\n')
if __name__ == '__main__':
import sys
convert_file(sys.argv[1], sys.stdout)