Question

我正在处理来自服务提供商的二进制数据。我使用C ++通过HTTP请求订阅这些数据。我不时地从这个提供者那里得到一个HTML有效载荷。 HTML有效负载实际上是二进制数据，如下所示：

! ¦ô¿ÂË¤ ÍÌL? Àÿ Àÿ¥ š™©@ Àÿ Àÿ或! H·ô¿ÂË¤ ÍÌL? Àÿ333?¥ š™©@ Àÿff¦@

我想使用我得到的数据进行模拟。为此，我在字符串中硬编码数据并启动将使用这些字符串的程序。

std::string input = "! ¦ô¿ÂË¤ ÍÌL? Àÿ Àÿ¥ š™©@ Àÿ Àÿ"

我遇到的第一个问题是我必须逃避\n之类的所有字符。但我不知道如何逃避\0。此外，我有这个错误消息，这可能是由于我没有正确地逃避文件结束字符的事实：

Error 3 fatal error C1004: unexpected end-of-file found

所以主要的问题是：文件结尾字符是什么样的，我怎么能逃脱呢？

然后，是否有linux命令或从二进制文件中获取二进制数据的方法，并使用\转义所有特殊字符，然后我只是将其粘贴到我的C ++代码中。

最后，我想将所有不同的有效负载放在二进制文件中，这样我就可以使用这个文件启动我的模拟了。问题是我不知道如何分离不同的有效载荷，因为只是进入下一行不会起作用，因为它将被解释为随机字符（并且有效载荷没有固定大小）。我不知道使用什么样的分隔符。

Answer 1

您可以将有效负载写入文件，并使用std::ifstream进行读取。这将允许您更改有效负载而无需重新编译。

如果你真的想把它存储为二进制数据，你可以使用一个char数组，并像这样初始化它：

const unsigned char raw_data[] = {
    0x21, 0x20, 0xc2, 0xa6, 0xc3, 0xb4, 0xc2, 0xbf,
    0xc3, 0x82, 0xc3, 0x8b, 0xc2, 0xa4, 0x20, 0xc3,
    0x8d, 0xc3, 0x8c, 0x4c, 0x3f, 0x20, 0x20, 0xc3,
    0x80, 0xc3, 0xbf, 0x20, 0x20, 0xc3, 0x80, 0xc3,
    0xbf, 0xc2, 0xa5, 0x20, 0xc5, 0xa1, 0xe2, 0x84,
    0xa2, 0xc2, 0xa9, 0x40, 0x20, 0x20, 0xc3, 0x80,
    0xc3, 0xbf, 0x20, 0x20, 0xc3, 0x80, 0xc3, 0xbf,
    0x60, 0x20, 0x6f, 0x72, 0x20, 0x60, 0x21, 0x20,
    0x48, 0xc2, 0xb7, 0xc3, 0xb4, 0xc2, 0xbf, 0xc3,
    0x82, 0xc3, 0x8b, 0xc2, 0xa4, 0x20, 0xc3, 0x8d,
    0xc3, 0x8c, 0x4c, 0x3f, 0x20, 0x20, 0xc3, 0x80,
    0xc3, 0xbf, 0x33, 0x33, 0x33, 0x3f, 0xc2, 0xa5,
    0x20, 0xc5, 0xa1, 0xe2, 0x84, 0xa2, 0xc2, 0xa9,
    0x40, 0x20, 0x20, 0xc3, 0x80, 0xc3, 0xbf, 0x66,
    0x66, 0xc2, 0xa6, 0x40, 0x0a,
};

std::string data(
    reinterpret_cast< const char* >(raw_data),
    reinterpret_cast< const char* >(raw_data) + sizeof(raw_data));

哦，顺便说一句，我使用以下简单的Python代码将您的有效负载转换为缓冲区：

#!/usr/bin/python

def convert_file(path, stream):
    data = open(path, 'rb').read()
    stream.write('const unsigned char raw_data[] = {')
    for i, char in enumerate(data):
        if i % 8 == 0:
            stream.write('\n   ')
        stream.write(' 0x%02x,' % (ord(char),))
    stream.write('\n};\n')

if __name__ == '__main__':
    import sys
    convert_file(sys.argv[1], sys.stdout)

在C ++字符串中使用二进制数据

1 个答案: